«Скарлет, ты можешь спеть мне песню?» – спрашиваю я у своего смартфона. Мгновение, и на экране появляется привлекательная девушка с гигантскими круглыми глазами, немного похожая на принцессу Лею в фантазиях японского аниматора, которая отвечает: «Я не пою. Может быть, лучше подыщем что-нибудь на Amazon?»

Скарлет – мой виртуальный ассистент. Ее вполне могли бы звать Моникой или Меган. Она также могла бы быть Джоном и носить вместо откровенного черного платья строгую белую рубашку с галстуком. При желании она даже готова превратиться в микрофон. Подобную возможность предусмотрели Илья Гельфенбейн, Павел Сиротин и Артем Гончарук – основатели российского стартапа Speaktoit, чье приложение Assistant пытается завоевать место под солнцем еще на совсем молодом, но невероятно перспективном и уже чертовски тесном рынке голосовых помощников для смартфонов.

Именно от них мне точно известно, что в данный момент Скарлет врет: она отлично умеет петь. Поэтому я повторяю предыдущую просьбу, но уже в чуть более вежливой форме. «Зачем? Ты заболел?» –  вдруг интересуется она. Я абсолютно здоров, но, как и любой мужчина, готов солгать в расчете на женскую жалость. Это работает. В награду я получаю несколько строчек про пушистого котенка, отлично знакомые любому, кто пробрался хотя бы через пару сезонов телесериала «Теория большого взрыва».

Судьба Speaktoit тесно переплетена с Siri, голосовым ассистентом для iPhone, который предлагает своим пользователям очень похожий функционал. Но не спешите приписывать Гельфенбейна, Сиротина и Гончарука к когорте российских предпринимателей, решивших заработать на копировании успешных западных концепций. Assistant играет с Siri на одном поле и, главное, был на нем первым.

Но именно появление Siri дало толчок развитию Assistant. Оно же теперь может помешать Speaktoit вырасти в большую и по-настоящему успешную компанию.

Прощальный подарок Джобса


Артем Гончарук

Илья познакомился с Павлом в Университете Брайтона, где они оба получали MBA. «У всех нас уже был какой-то опыт в компьютерной лингвистике: с Артемом мы занимались исследованиями в этой области еще в Новосибирске, а у Павла и вовсе лингвистическое образование», – рассказывает Илья. Идея начать свой бизнес родилась в середине 2010 года. «В какой-то момент стало ясно, что нужно что-то делать. Технологии к тому моменту уже позволяли создать говорящего ассистента, понимающего смысл человеческой речи. И мы решили попробовать», – продолжает Илья, который занял в новой компании должность CEO. По его словам, Speaktoit не был данью моде: «Не было такого чувства, что «блин, я хочу собственный стартап». Мы просто не видели других вариантов. Это было естественно».


Павел Сиротин

«У меня всегда была мечта иметь собственный бизнес. У родителей было собственное небольшое издательство, и я, когда был еще маленький, смотрел, как все это развивается, и думал, как все это круто», – объясняет Сиротин.

Начальные этапы развития Speaktoit – хрестоматийная иллюстрация пути любого стартапа. «Работали дома, постоянно не спали, жили на зарплаты жен», – вспоминает Павел Сиротин. Через несколько месяцев ребята почувствовали, что готовы продемонстрировать миру свое приложение: бета-версия Assistant появилась в магазине Android в мае 2011 года.

С тех пор Assistant обрастает различными функциями. Сегодня он отправляет SMS вашим друзьям, ищет поблизости рестораны с тайской кухней, апдейтит ваш статус в Facebook и удовлетворяет ваше интеллектуальное любопытство информацией из Wikipedia. Все, что для этого нужно  знать английский, русский или испанский языки, обладать неплохой дикцией и владеть смартфоном на базе Android, iOS или Windows Phone. По словам создателей, Assistant на сегодняшний день скачали более 4 млн человек, 40% из которых являются активными пользователями. Самый популярный язык – английский.

В первые месяцы своей жизни Assistant, однако, не интересовал никого за пределами узкого круга технологических гиков. Чтобы попасть на радары рядовых потребителей, Speaktoit пришлось дождаться появления первого могущественного конкурента. В начале октября 2011 года Apple презентовала iPhone 4S, главной фишкой которого как раз и стал персональный ассистент Siri. Весь мир в один миг сошел с ума: внезапно все осознали, что им срочно необходим свой собственный умный помощник. Это был прощальный подарок Стива Джобса, который в последний раз продемонстрировал, что знает о желаниях людей значительно больше, чем они сами.


Илья Гельфенбейн

Speaktoit собирались выпускать основной релиз в ноябре 2011 года, но уже в октябре вышла Siri. Спрос на приложение резко подсчкочил. В результате компания в авральном режиме столкнулась со всеми проблемами, связанными с большими нагрузками, которые только можно себе вообразить. «Самое смешное, что я в этот момент был как раз в Калифорнии и общался с потенциальными инвесторами. Буквально каждый час у нас что-то выходило из строя. Поэтому в момент демонстрации я не знал, сработает ли сейчас сервис или нет. Это была достаточно драматичная ситуация», – вспоминает Гельфенбейн.

Поведение инвесторов почти полностью повторяло поведение рядовых потребителей. С появлением Siri озарение снизошло и на них. «Когда мы только начали встречаться с разнообразными венчурными фондами и показывать им Assistant, все отвечали: вау, это круто, но мы как-то не верим, что люди начнут вдруг разговаривать со своими смартфонами», – рассказывает Гельфенбейн.

«После появления Siri интонации инвесторов изменились. Вдруг все они начали говорить: „Ну наконец-то. Мы этого ждали уже лет двадцать“».

На этой волне Speaktoit удалось сначала получить грант от «Сколково», а спустя еще несколько месяцев привлечь деньги от фонда Intel Capital. Размеры инвестиций Гельфенбейн раскрывать отказывается, но в случае c Intel речь, по экспертным оценкам, вполне может идти о нескольких миллионах долларов. Деньги позволили Speaktoit начать расширяться. Сейчас в компании работают 17 человек, разбросанные по всему земному шару. Пока Илья общается с инвесторами в Калифорнии, Павел руководит лингвистами в небольшом офисе в Москве, технический директор Артем живет в Вашингтоне, а команда программистов оккупировала Новосибирск.

Здесь нет своего Google

Желание людей разговаривать со своими компьютерами вполне естественно. Первые фантазии об интеллигентном диалоге человека и машины появились даже до изобретения транзистора. Об этом грезил отец «искусственного интеллекта» Алан Тьюринг и тысячи его последователей, а фантасты наводнили нашу поп-культурную мифологию образами чрезвычайно умных ассистентов.

«В будущем виртуальные помощники будут востребованы, это давно очевидно: вкалывают роботы, счастлив человек, ты даешь задание, машина его выполняет. Когда-то это время должно наступить», – объясняет Илья. Кусочки технологического пазла, необходимые для создания первых подобных пользовательских продуктов, начали складываться к началу этого десятилетия. «Широкое распространение смартфонов, облачные сервисы, развитие технологий распознавания и синтеза речи...» –  перечисляет Гельфенбейн.

Не хватало лишь последнего элемента – надежного механизма обработки человеческого языка, который бы позволял ассистенту разбирать смысл сказанного, а не просто реагировать на последовательность звуков. За развитие этого направления, центрального для всей сферы искусственного интеллекта и математической лингвистики, и взялась команда Speaktoit, отдав разпознавание и синтез речи на аутсорсинг сторонним компаниям.

Не стоит заблуждаться. Assistant, как и прочие аналогичные сервисы, далеко не совершенен. Он не всегда точно понимает, что ему говорят, а заметная доля просьб заканчиваются обещанием аватара «научиться этому в самое ближайшее время».

Но хотя все это пока предельно далеко от научной фантастики, это уже и не заточенные под строгие словесные комбинации системы, объясняют создатели: «Мы действительно пытаемся понять, о чем говорит пользователь, анализируем структуру и состав фразы, а также ее временной и географический контекст. Но самое главное – это поддержка диалога».

– Сегодня будет дождь?

– В Москве обещают ясную погоду.

– А завтра?

– Завтра будет пасмурно. Возможны осадки.

Именно в такие моменты мы начинаем проникаться к виртуальным ассистентам искренней и абсолютно человеческой симпатией. «Недавно на наш ящик Speaktoit пришло письмо от мужчины, чей сын болен синдромом Аспергера. По словам отца, мальчик никогда не разговаривал с людьми, но недавно вдруг начал общаться с Assistant. В этот момент я почувствовал, что мы делам что-то важное», – говорит Сиротин.

В Speaktoit уверяют, что не пытаются сделать из ассистента друга для человека, но, судя по всему, это может произойти само собой. Исследования профессора Стэнфордского университета Клифорда Насса показали, что люди настолько привыкли общаться друг с другом с помощью голоса, что наш мозг воспринимает даже скверно разговаривающий компьютер как живое существо. Что уж говорить о ситуациях, когда смартфон начинает поддерживать с тобой беседу?

В теории превосходство голоса над другими способами коммуникации человека с компьютерами настолько неоспоримо, что реальность, в которой виртуальные ассистенты станут нашими вечными компаньонами, кажется неизбежной. «Конечная цель – создать приложение, без которого невозможно жить. Если ты забыл дома телефон, то вместе с ним ты забыл, какие у тебя планы, и не знаешь, куда тебе сходить поесть», – объясняет Гельфенбейн. На создание подобного сервиса, впрочем, может потребоваться около десяти лет. Нынешнюю ситуацию на рынке голосовых помощников, по его словам, можно сравнить с рынком интернет-поиска в 90-х годах: «Здесь пока еще нет своего Google».

На волне цунами

Согласно последнему отчету Vision Mobile, в мире насчитывается более сорока независимых виртуальных ассистентов для смартфонов. Есть Iris и есть Risi, Andy и Serge, Edwin и Evi. Они не должны пугать Speaktoit. В комплекте с многими из них идет гигантский список команд и соответствующих им функций: изменил порядок слов – не смог поставить будильник.

Главная опасность должна прийти со стороны гигантов индустрии. Успех Siri заставляет конкурентов Apple спешно готовить ответный удар. Samsung уже встроил схожий по функциональности сервис в свои смартфоны Galaxy S III. По слухам, на очереди Nokia и Microsoft. Наконец, Google обладает всеми необходимыми ресурсами для создания по истине убийственного ассистента, который будет интегрирован в подконтрольный ему Android. Это грозит большими неприятностями для Assistant, около 90 процентов пользователей которого приходится как раз на эту операционную систему.

Но Google российских стартаперов совершенно не пугает, уверяет Гельфенбейн. «Глупо думать, что несколько десятков тысяч сотрудников Google сядут и вместе начнут делать виртуального ассистента. Это будет такая же небольшая группа людей», – говорит он.

«Мы соревнуемся не с гигантскими корпорациями с капитализацией в сотни миллиардов долларов, а с конкретными людьми, которые к тому же могут быть меньше мотивированы, чем мы».

Пока они будут догонять Speaktoit, проект будет двигаться дальше, считают основатели. Ведь по их словам, некоторые владельцы iPhone отдают предпочтение нам, даже не смотря на наличие Siri.

Главным достоинством Assistant перед крупными игроками является активная поддержка сторонних сервисов. Во время презентации последнего iPhone Скотт Форстал, вице-президент Apple, хвастался, что Siri научилась писать статутсы в Facebook. Assistant умеет это давно. Уже сейчас Speaktoit сотрудничает с несколькими десятками сторонних приложений, и их число продолжает расти. Но вечно сохранять это преимущество у Speaktoit не получится: не сегодня, так завтра Apple или Google разрешат сторонним разработчикам самостоятельно интегрировать голосовые ассистенты в свои сервисы. И это должно беспокоить Гельфенбейна.

Vision Mobile оценивает выручку всех разработчиков виртуальных ассистентов за минувший год в жалкие $2 млн. Тем не менее в перспективе рынок голосовых помощников – это многомиллиардный бизнес. Каким образом будут достигнуты подобные масштабы? Во-первых, виртуальные ассистенты обещают стать нашим проводником во вселенной мобильных сервисов. Они будут бронировать за нас отели и столики в кафе, а также покупать книжки, музыку и билеты в кино, получая отчисления за посредничество. Во-вторых, не стоит ожидать, что амбиции Assistant, Siri и им подобных ограничиваются крохотными экранами смартфонов. Мы не успеем моргнуть, как они поселятся в домах и автомобилях, а также оккупируют телевизоры и разнообразную бытовую технику. Это откроет невиданные возможности для монетизации. Во всех этих направлениях уже идет работа, говорит Гельфенбейн. Главное сейчас – продолжать наращивать пользовательскую базу и, по словам, Гельфенбейна, «не бояться».

В мире передовых технологий статус пионера зачастую не дает тебе особых преимуществ. Любая фора отыгрывается задолго до финиша. Siri запустила цунами, которое пока поднимает Speaktoit все выше и выше. Но это же цунами однажды может похоронить Speaktoit в своих пучинах. Однако у IT-индустрии есть и другая особенность: до последнего момента никогда нельзя быть уверенным, как сложится будущее.

– Скарлет, ты можешь предсказывать будущее?

— Я стараюсь делать все, что в моих силах, чтобы удовлетворять любые твои нужды. И даже если я не умею что-то сегодня, я могу научиться этому завтра.