Санкт-петербургский офис компании «Яндекс».

Санкт-петербургский офис компании «Яндекс».

Фото: Сергей Коньков / ТАСС

«Яндекс» объявил о запуске нового поискового алгоритма, который получил название «Палех». «Палех» должен научить поиск понимать не только ключевые слова в запросе, но и его смысл. Например, при запросе «Песня, которую крокодил поет на поезде», система должна выдавать ссылки на песню «Голубой вагон». Slon Magazine объясняет, зачем понадобился новый алгоритм, что в нем нового и когда поисковый робот начнет понимать запросы не хуже человека.

Зачем нужен новый алгоритм?

Хотя «Яндекс» уже давно вовсю развивает непрофильные направления, вроде онлайн-службы такси или сервиса доставки, поиск остается основным продуктом, а реклама – основным источником выручки. Периодически «Яндекс» запускает новые алгоритмы поиска для того, чтобы улучшить качество результатов выдачи по запросу пользователя.

По данным «Яндекса», его поисковая система ежедневно обрабатывает 280 млн запросов. Какие-то запросы однотипны и повторяются очень часто – например, «погода», «вконтакте». Большую часть запросов в компании относят к категории средней частотности. И есть уникальные запросы – их могут задать всего несколько раз, но в сумме это больше трети всех запросов к поисковику: около 100 млн за день. Например, как объясняют в «Яндексе», дети часто задают вопросы, как будто общаются с живым собеседником: «Дорогой яндекс посоветуй пожалуйста новые интересные игры про фей». Впрочем, так делают не только дети. В июле 2016 года широко разошлась история о 85-летней британке Мэй Эшворт, которая вежливо общалась с Google: «Пожалуйста, переведите эти римские цифры, спасибо».

Большая часть уникальных запросов касается фильмов, книг, песен, когда пользователи помнят только фрагмент или несколько слов, а хотят найти само произведение. В качестве примера в «Яндексе» приводят запрос о фильме «Марсианин» – «фильм где человек сажал картошку на другой планете». Специалисты «Яндекса» оптимизировали алгоритм поиска и научили его понимать смысл таких запросов.

Почему «Палех»?

«Яндекс», существующий с конца 1990-х годов, уже много раз менял алгоритм поиска, в среднем это происходит раз в полгода-год. По традиции алгоритмы получают названия в честь городов – предыдущие назывались «Магадан», «Находка», «Арзамас», «Снежинск». Иногда у названия есть объяснение – «Минусинск» боролся с SEO-оптимизаторами, продвигавшими сайты в выдаче (оптимизаторы сразу стали называть его «Минус»), а «Рейкьявик» стал оптимизировать выдачу по языковому принципу. Google также использует названия для своих алгоритмов – «Панда», «Пингвин», «Кофеин».

Название «Палех» в компании объясняют так: график частоты всех запросов за день напоминает птицу: частые запросы образуют клюв, среднечастотные – тело, а уникальные – хвост птицы. При этом хвост длинный, поскольку частота запросов низкая, но их самих много. В «Яндексе» решили, что хвост напоминает о сказочной Жар-птице, которая изображается в палехской миниатюре, – например, при росписи шкатулок.

При чем здесь нейронная сеть?