Getty Images / Laguna Design

Впервые понятие «искусственный интеллект» употребил американский ученый, основоположник функционального программирования Джон Маккарти. Выступая на конференции в далеком 1956 году, он отметил, что слово «интеллект» (хотя английское слово «intelligence» из оригинального определения «Artificial Intelligence» несколько шире русского аналога, оно может означать и «интеллект», и, например, «ум») не нужно понимать в узко антропном смысле, то есть искусственный интеллект вовсе не обязательно должен напоминать интеллект человеческий. «Проблема состоит в том, – говорил Маккарти, – что пока мы не можем в целом определить, какие вычислительные процедуры мы хотим называть интеллектуальными. Мы понимаем некоторые механизмы интеллекта и не понимаем остальные. Поэтому под интеллектом в пределах этой науки понимается только вычислительная составляющая способности достигать целей».

Никакого единственно верного определения искусственного интеллекта не существует, но если постараться описать этот феномен максимально общо, – это способность воспринимать окружающую информацию и принимать решения, максимизирующие вероятность успеха.

В общественном сознании, в первую очередь благодаря популярной культуре, сложилось представление, что искусственный интеллект – это обладающие почти человеческим сознанием андроиды или мыслящие машины, вроде компьютера HAL из «Космической одиссеи 2001 года» Стэнли Кубрика. Безусловно, и то и другое примеры ИИ, но в действительности искусственный интеллект – не фантастика будущего, а то, что повсеместно и каждый день встречается в жизни почти любого человека уже сегодня, а может, и несколько тысяч лет назад.

«На протяжении тысячелетий мы создаем вещи, помогающие человеку что-то делать, например быстрее передвигаться. Важно, что есть некоторый элемент, заменяющий функции, которых у нас нет изначально. Мы создали колесо, паровоз, самолет. А сегодня у нас есть и ИИ», – говорит Татьяна Даниэлян, заместитель директора по разработке технологий компании ABBYY. Конечно, сравнивать колесо и ИИ – это смело, но между ним и мыслящим роботом находится очень много других примеров, в частности почти любое программное обеспечение. Рыночная экономика устроена таким образом, что технический прогресс идет скорее в направлении удовлетворения человеческих потребностей, чем в сторону романтических прорывов, предсказанных научными фантастами; быть может, именно поэтому роботы, обладающие полноценным «человеческим» разумом, до сих пор не созданы (хотя и здесь достигнут немалый прогресс), зато информационные системы год от года берут на себя все больше отдельных человеческих функций – от выбора лучшего ресторана до управления автомобилем и выполнения сложных хирургических операций.

Rule-driven и data-driven

При создании систем ИИ, способных выполнять сложные функциональные действия – это могут быть и роботы, и, например, поисковые интернет-машины, – используются два основных подхода: на основе правил (rule-driven) и на основе данных (data-driven).

Для того чтобы понять разницу между ними, проще всего посмотреть на системы извлечения информации. К примеру, нужно извлекать факты встреч между различными людьми. Специалисту надо написать большое количество правил, которые описывают поведение слов «встреча», «принять участие», «общаться», «гулять» и т.п. в предложениях. Учесть надо все возможные смысловые синонимы слова «встреча» и написать правила, по которым машина сможет определить кто, когда, где и с кем встречался.

Без всего этого можно обойтись, если есть в большом количестве тексты, в которых специалист выделил маркером факты встречи. Такого рода тексты (размеченные) можно использовать для обучения. Выбирается алгоритм машинного обучения и набор признаков.

У обоих подходов есть свои плюсы и минусы и области применения. Так, data-driven-подход успешно применяется в задачах извлечения именованных сущностей. Rule-driven-подход применяется в задачах извлечения фактов и событий.

Подходы Rule-driven и data-driven в принципе не столько конкурируют, сколько дополняют друг друга. Но есть задачи, где один из них работает намного эффективнее другого.

«Подход на основе данных, а именно статистические методы и машинное обучение, в частности, используется для распознавания образов, текста, – рассказывает Даниэлян. – У нас есть некоторый набор данных, на которых можно обучиться. Например, нам нужно распознать букву “А”. Мы берем различные виды ее написания, компонуем определенным образом и говорим классификатору: обучайся на таких и таких признаках. Для обучения должно быть обучающее множество – набор данных, документов, в которых встречается буква “А” в разном начертании. Вот из этих составляющих машинного обучения – классификатора, то есть алгоритмов, признаков (тех характеристик, на которые алгоритмы опираются при обучении) и данных – и состоит в данном случае искусственный интеллект».

Getty Images

Даниэлян говорит, что этот подход чрезвычайно силен и может использоваться для прогнозирования практически в любой отрасли: «Например, у вас есть данные о выборах в какой-то области за 20 лет. Вы можете на их основе обучить систему и задать ей вопросы: какова будет явка избирателей, если мы проведем выборы 7 ноября? Какова вероятность, что вот эта партия преодолеет избирательный порог? Если данных для обучения было достаточно много, можно учесть почти что угодно: температуру воздуха, дачный период, какие в этот момент показывают по телевизору сериалы и т.п.».

Особенность основы подхода data-driven, машинного обучения, в том, что с практической точки зрения не очень важно, как именно будет выглядеть прошедший обучение алгоритм. С точки зрения пользователя – это своего рода «черный ящик», программа, написавшая себя сама на основе специфической задачи. Такой «черный ящик» будет хорошо и эффективно работать, если для обучения системы имелось очень много данных. Это логично: чем больше букв «А» в разных написаниях видел распознаватель текста, тем лучше он определит эту литеру в следующий раз.

«Подход rule-driven часто используют в ситуациях, когда не хватает данных, на которых можно было бы обучиться», – говорит Даниэлян. Устроен этот метод примерно так: допустим, нужно извлечь из текста все собственные имена. Алгоритм идет по тексту и смотрит слова, начинающиеся с заглавных букв. Каждое из них он сравнивает с обычным словарем и словарем собственных имен. Если слово не встречается в первом и встречается во втором, скорее всего, оно подходит. Это и есть правило, «rule». Однако составить список всех возможных имен и фамилий невозможно, кроме того, фамилия вполне может оказаться обычным словарным словом. Заглавная буква тоже не спасает, ведь слово может стоять в начале предложения. Ясно, что алгоритм можно усовершенствовать, по возможности учтя все возможные варианты, но даже тогда сложно гарантировать, что он будет работать безошибочно. «Правила часто дают сбой, потому что язык устроен очень сложно». Но когда данных просто слишком мало, подход оказывается практически безальтернативным. Кроме того, очень часто алгоритмы, основанные на правилах, могут дополнить подход data-driven.

ИИ вокруг нас

Нас окружает множество устройств, в той или иной степени обладающих искусственным интеллектом. Кондиционер знает, когда ему нужно включиться или выключиться, чтобы поддержать нужную температуру, – это, конечно же, rule-driven-система. Персональный помощник в смартфоне, такой как Siri в iPhone, умеет обрабатывать естественную речь и не только способен выполнять стандартные функции вроде отправки сообщения, но и изучать предпочтения пользователя на протяжении долгого времени, чтобы лучше давать ему рекомендации, – и здесь уже используется data-driven-подход.

'Siri' на 4S

Getty Images / Oli Scarff

Все в большей степени от искусственного интеллекта зависит дорожное движение. Камеры фиксации превышения скорости на шоссе умеют считывать автомобильный номер, определять скорость и автоматически принимать решение о том, должен ли быть выписан штраф. Татьяна Даниэлян говорит, что в развитых странах практически все светофоры программируются машинами: их режим рассчитан поминутно в зависимости от средней нагрузки на дорожном участке. ИИ же принимает решение об обработке трассы реагентами, определяя температуру воздуха и асфальта, наличие льда и учитывая прогноз погоды. Наконец, все больше появляется эффективных систем автоматического управления автомобилем: по прогнозам производителя электромобилей Tesla, уже в ближайшие десятилетия роботы заменят водителей в 90% транспортных средств.

Самоуправляемый автобус, курисирующий между институтом науки и технологии Масдар и остановками

Getty Images / Bloomberg / Duncan Chard

Вообще говоря, мы даже не заметили, как роботы перестали быть фантастикой – робот-пылесос или робот-газонокосилка встречается во многих домах, роботические хирургические системы уверенно заменяют человека при проведении особенно тонких операций, например на глазах. Даниэлян рассказывает, что есть даже роботы-психотерапевты. Их задача – определить, когда у человека начинается депрессия, проявляются какие-то суицидальные наклонности, успокоить его и привести в нормальное состояние. И многие люди действительно не понимают, что общаются не с врачом, а с компьютером.

Cистема Ellie

USC Institute for Creative Technologies

Впервые такая программа (ELIZA) была создана в 1966 году в Массачусетском технологическом институте (Massachusetts Institute of Technology, MIT).

Структуризация и обработка

У всех этих систем похожая структура – они получают информацию на входе (например, с помощью датчика температуры, как кондиционер, или микрофона, как Siri), распознают и структурируют ее (полученные данные нужно перевести в понятный машине общий формат), обрабатывают (например, камера на автотрассе – с помощью простого rule-driven-алгоритма, а интернет-поисковик – с помощью статистически обученного «черного ящика») и выдают информацию на выходе (решение о выписывании штрафа, поисковая выдача, результат машинного перевода, поворот робота-пылесоса на 90 градусов влево).

Хотя на первый взгляд кажется, что самым сложным является этап обработки данных, это не всегда так, особенно если речь идет о подходе data-driven. Здесь качество работы системы зависит не столько от заранее созданного человеком сложного алгоритма, сколько от количества и качества данных, «скормленных» машине в процессе обучения. Данных в мире создается очень много, по оценкам IBM, несколько миллиардов гигабайт ежедневно. Но готов ли работать с этой информацией искусственный интеллект?

«90% данных в мире – не структурированы, это просто поток текста, звука, изображений, аналоговых данных. Он идет из соцсетей, из интернета, из СМИ, со всевозможных датчиков», – говорит Татьяна Даниэлян. Чтобы мы могли использовать информацию, ее нужно привести в структурированный цифровой вид, грубо говоря, базу данных, содержащую текстовые и цифровые поля. И это почти всегда оказывается крайне трудоемкой и нетривиальной задачей.

Например, очень много данных и вообще в мире, и на уровне отдельных компаний и организаций представлены в виде бумажных документов. Для того чтобы включить эти данные в систему обработки, их необходимо оцифровать, причем не просто прочесть каждую букву, но и разобраться со структурой документа. Специальные системы распознавания текстов способны распознать документы практически любого вида – от книг до бланков или анкет ЕГЭ. «Вы можете взять телефон, сфотографировать мою визитку, и мои контакты сразу же появятся у вас в телефоне. Или, находясь в ресторане, фотографируете меню – оно будет распознано, отправлено на сервер, переведено – вам придет результат. И без искусственного интеллекта здесь не обошлось», – рассказывает Даниэлян.

Еще одно любопытное направление – структуризация и анализ информации. И используется этот подход в самых разных областях – от оценки рисков при выдаче банковских кредитов до оптимизации работы службы технической поддержки.

Например, вы приходите в банк получать кредит. Сотрудники интересуются вашей финансовой ситуацией – наличием имущества, обремененностью другими кредитами. Вы можете сказать: у меня все в порядке, семья, квартира, других кредитов нет. Дальше банковские аналитики начинают вас проверять по различным базам данных, по социальным сетям, по той информации, которая есть о вас в интернете. Их задача – извлечь из всей этой разнородной информации достаточно данных, чтобы принять решение о выдаче кредита. Оказывается, теперь эту работу может в основном взять на себя машина. «Если уже собрано большое количество документов, наша система Compreno может проанализировать каждый из них, извлечь упоминание вашей персоны и сказать: вот в этих документах встречается этот человек, у него такая-то должность в такой-то организации, он в ней работает с такого-то года, его финансовый и социальный статус такой-то. Получится на вас некоторое досье», – рассказывает Даниэлян.

Иллюстрация работы ПО Compreno от ABBYY

Решение о выдаче займа все равно принимает кредитный специалист, но теперь у него для этого не ворох разнородных документов, а короткая справка, содержащая всю релевантную информацию. Главная задача машины – именно структурировать данные.

«Дальше вы сможете их использовать как хотите, – говорит Даниэлян. – Например, у вас есть система документооборота, ваша компания каждый день регистрирует договоры, и вы должны отследить по каждому контракту, когда он заканчивается, когда нужно его продлить, какую сумму вам должны заплатить, когда вы должны что-то заплатить сами, кто агент, кто контрагент. Вот машина может всю эту информацию извлечь и структурировать. И дальше в вашей системе документооборота будет возникать информация, что договор номер такой-то – такой-то агент, такой-то контрагент, тема договора такая, сумма такая; внимание: через неделю нужно по нему платить».

Еще один пример применения системы – обработка обращений граждан или оптимизация службы технической поддержки. «Например, как работает электронная приемная российской Госдумы, – рассказывает Татьяна Даниэлян. – Каждый гражданин может оставить на сайте Думы жалобу. По законодательству вам должны ответить очень быстро – в течение суток. Для того чтобы в течение суток ответить, нужно, чтобы армия людей распределяла и обрабатывала все жалобы, и то они не справляются. А так там стоит наш классификатор, который анализирует текст запроса, устанавливает ему определенный приоритет и отправляет соответствующему специалисту». При этом Даниэлян рассказывает, что система обучаемая:

«Мы ей сказали: смотри, вот в этой папке лежат всякие крики души, вот здесь лежит то, что касается транспорта, вот это – то, что касается ЖКХ, и так далее. И на этом система обучилась и теперь сама может определить, какое новое обращение к какой категории относится».

Аналогичным образом система способна помочь службе технической поддержки значительно оптимизировать свою работу. Машина не только умеет маршрутизировать обращения по операторам и устанавливать им приоритет на обработку, но и способна автоматически отделить те случаи, когда требуется вмешательство технического специалиста от тех, когда пользователю нужно объяснить, как правильно пользоваться продуктом. «По нашему собственному опыту только около 30% обращений связаны с тем, что что-то действительно неправильно работает. Остальные 70% – это когда люди не понимают, как использовать какую-то функцию. Наша задача эти 70% сократить, эффективно обработать так, чтобы пользователи хотели потом купить следующую версию продукта. И тогда технические специалисты смогут обрабатывать за то же время не два сообщения, а десять».

Будущее наступает

Когда-то казалось, что искусственный интеллект в один прекрасный день ворвется в нашу жизнь в виде андроидов, способных на равных общаться с человеком, писать стихи и обсуждать философские вопросы. Этого пока не произошло, но это совершенно не значит, что мы не продвинулись в создании мыслящих машин. Просто тайна интеллекта разделяется на несколько отдельных загадок – это распознавание образов воспринятых органами чувств, структурирование информации, ее обработка и принятие решений. Каждый из этих блоков уже в той или иной степени воспроизведен в системах искусственного интеллекта, и если присмотреться, они выглядят не менее магическими, чем мыслящие роботы. Что еще важнее – они полезны человеку, освобождают его от рутинной работы, помогают справляться с информацией, поток которой в современном мире экспоненциально растет.

Китайский суперкомпьютер Tianhe-2

TASS / ZUMA / Long Hongtao

Впрочем, кто знает, может быть, и андроиды появятся у нас совсем скоро? Ученые ожидают, что к 2025–2030 годам производительность компьютера стоимостью тысяча долларов достигнет производительности человеческого мозга. Сегодня самый быстрый суперкомпьютер, китайский Tianhe-2, превысил производительность человеческого мозга: 3,4 1016 FLOPS. Пока он занимает помещение площадью 720 квадратных метра, стоит $390 млн и потребляет 24 мегаватта электроэнергии (против 20 Вт, которые нужны человеческому мозгу), но прогресс не стоит на месте – особенно в том, что касается компьютерной техники и систем обработки информации.