Если хоть немного следить за новостями мира технологий, невозможно не заметить, что нейросети превратились в идеального ученика. Каждый день они обучаются чему-то новому: находить людей в толпе прохожих, рисовать как Ван Гог, вести беседу, управлять автомобилями, писать стихи. В бесконечном списке навыков нейросетей несложно затеряться, их возможности кажутся безграничными и угрожающими. Но действительно ли возможности машинного интеллекта уже продвинулись так далеко? Об этом мы поговорили с Артуром Кадуриным, главой отдела искусственного интеллекта компании InSilico Medicine, которая с помощью нейросетей разрабатывает новые лекарства. В начале декабря выйдет книга «Глубокое обучение» в соавторстве Кадурина.
— В вашей книге говорится, что сейчас идет новая технологическая революция. Что имеется в виду?
— Считается, что сейчас идет третья волна развития нейросетей. Первая была в 50-е, когда Фрэнк Розенблатт предложил архитектуру перцептрона — первую нейронную сеть, которая умела решать простые задачки. Тогда все решили, что скоро грядет эпоха искусственного интеллекта. Но ничего не получилось, потому что не было ни мощности, ни понимания, ни матаппарата.
Ближе к концу XX века появились первые архитектуры, которые хорошо работали на изображениях и достигали практически человеческой точности по уровню распознавания цифр, букв и иногда речи. А после того, как появилась нейросеть AlexNet, которая на стандартном наборе данных по распознаванию классов изображений показала на порядок лучший результат, чем все предшественники, началась текущая волна развития нейросетей. Она отличается от предыдущих тем, что сейчас практически во всех областях, где применяются нейросети, результаты их эффективности выше, чем у людей. Google в прошлом году показал программу AlphaGo, которая обыграла одного из чемпионов мира и продолжает работать над улучшением алгоритмов. Недавно они обновили свое решение и показали, что программа может обучиться играть в го лучше, чем люди, даже не глядя на историю игр людей. Ей достаточно играть только с самой собой. Это очередной прорыв. Конечно, во многих других областях тоже есть прорывы. Посмотрите, как сильно за последнее время улучшился машинный перевод. Все очень изменилось на рынке рекламы. Везде сейчас используется машинное обучение, и невозможно представить, как десять лет назад менеджер вручную размещал бы контекстную рекламу. Этого теперь недостаточно, чтобы развивать бизнес.
— А какие главные технологические прорывы последних лет?
— Во-первых, генеративный подход в нейронных сетях. Несколько лет назад Ян Гудфеллоу опубликовал статью, в которой использовалась новая архитектура. Идея в том, чтобы обучать одновременно две нейронные сети. Одна — это генератор, пытающийся воспроизвести, например, картинку, похожую на те, что он встречал в обучающей выборке. Вторая нейросеть — критик, дискриминатор, который смотрит на изображения из обучающей выборки и на изображения, которые нарисовал генератор. Она обозначает те из них, в которых угадывает «руку» генератора. Происходит состязание, во время которого обе нейросети учатся делать свое дело лучше. Таким подходом сейчас решается очень много разных задач: и общение на естественном языке, и рисование, и создание новых лекарственных препаратов.