В марте 2020 года стартовал весьма необычный междицсплинарный проект, цель которого — с помощью ИИ и машинного обучения понять язык китов и, возможно, даже научиться с ними разговаривать. Описанию Project CETI (Cetacean Translation Initiative) посвящен лонгрид в Hakai Magazine.
Все началось в 2017 году, когда международная группа ученых отправилась в Гарвард по стипендии Radcliffe Fellowship, обещающей в научном плане «возможность отвлечься от рутины». Шафи Гольдвассер, криптолог и информатик из Израиля, зашла в офис к морскому биологу Дэвиду Груберу, где услышала щелкающие звуки, напомнившие ей азбуку Морзе. Она в шутку предложила запустить проект по расшифровке «разговоров» китов. «Даже и не думала, что он воспримет всерьез мое предложение», — впоследствии вспоминала она. Но Radcliffe Fellowship как раз давала им такую возможность.
Чуть позже они озвучили идею программисту Майклу Бронштейну из Императорского колледжа Лондона, который как раз занимался обработкой естественного языка (natural language processing, NLP) — он решил, что у «щелчковой» речи кашалотов есть некая структура, которая вполне подлежит анализу с помощью ИИ. У Грубера также был знакомый морской биолог со множеством записей переговоров китов, и Бронштейн с помощью алгоритмов машинного обучения начал их анализировать.
«Кажется, алгоритм неплохо сработал. По крайней мере, на относительно коротких предложениях», — говорит он. Но это был всего лишь пробный камень. Для более глубокого анализа алгоритмам требовалось больше контекста и куда больше информации — миллионы «диалогов» китов.