Михаил Иванов и Артем Кухаренко. Фото: Арсений Несходимов для Republic

В конце сентября в Москве установили 3000 камер с функцией распознавания лиц. Алгоритм, обрабатывающий данные с камер, помогает, среди прочего, искать преступников, и московские власти уже сообщают, что более половины разыскиваемых так лиц удается найти. Впрочем, для законопослушных граждан новая система видеонаблюдения тоже означает конец приватности.

Компания NtechLab, которая разработала алгоритм, стала широко известна после того, как предоставила свою технологию сервису FindFace: по фотографии человека он позволяет найти его профиль «ВКонтакте». Сервис вызвал кучу вопросов – его, например, стали использовать для шантажа: находили аккаунты женщин, снимавшихся в порно, и угрожали предать эту информацию огласке.

Несмотря на скандальную репутацию, сама технология NtechLab уже признана в мире. В 2015 году российский алгоритм превзошел алгоритм команды Google на соревнованиях в США. Теперь компания занимает первое место в конкурсе Национального института стандартов технологий США. Об этом, а также о конце эпохи приватности и китайских конкурентах мы поговорили с основателем NtechLab Артемом Кухаренко и генеральным директором Михаилом Ивановым.

– О вас начали говорить после конкурса MegaFace в 2015 году. Тогда вы заняли первые места в нескольких номинациях, обогнав команду Google. В чем было преимущество вашей технологии?

Артем Кухаренко: В том, что мы давно работали над этой задачей. В то время все были сфокусированы на верификации. Это не такая сложная задача: система просто сравнивает две фотографии и определяет, изображен ли на них один и тот же человек. Идентификация – на порядок сложнее, она предполагает поиск человека по большой базе фотографий. Мы видели, что именно эту технологию можно широко применять в реальных условиях и прицельно ей занимались. Организаторы соревнования MegaFace тоже постепенно пришли к проблеме идентификации и сделали конкурс с поиском по базе в миллион фотографий. А мы в тот момент готовились к запуску сервиса FindFace, который искал по базе в 250 млн изображений.

– На том соревновании самый слабый результат был у поиска по базе фото людей разных возрастов. Вам удалось как-то увеличить точность в этом направлении или Google вас в этом по-прежнему опережает?

Кухаренко: Удалось. На MegaFace мы отправили первую версию нашего алгоритма – прежде всего, чтобы оценить наши возможности. После этого была проделана огромная работа по усовершенствованию технологии. Мы повысили эффективность распознавания людей разных возрастов и рас. Первоначально алгоритм лучше распознавал европейцев, а африканцев и азиатов – хуже. Cейчас точность распознавания азиатов даже несколько выше, чем для представителей остальных рас. Хотя разница невелика – в пределах погрешности.

О возможностях Google с того соревнования ничего не слышно, они больше нигде не публиковали свои результаты. После завершения конкурса организаторы MegaFace выложили в открытый доступ датасет, на котором тестировали алгоритмы. Из-за этого площадка перестала быть для нас интересной, и мы решили больше не участвовать. Нет никакого смысла бесконечно затачивать алгоритм под одну базу и добиваться 100% точности. Это никак не поможет в реальных условиях: если подключить такой алгоритм к камере видеонаблюдения, он покажет очень низкую точность.

Сегодня нам гораздо интереснее соревнования по face recognition, которые проводит NIST, Национальный институт стандартов технологий США. Они делают все очень грамотно – не выкладывают базу в открытый доступ, а предлагают производителям присылать свои решения. Институт сам тестирует алгоритмы в закрытом режиме, а затем публикует результат. По сути, это соревнование бесконечно, его результаты постоянно обновляются: туда можно отправлять свои разработки раз в три месяца. Сейчас у нас там лучшие результаты по поиску по базам в неконтролируемых условиях, то есть по изображениям с камер видеонаблюдения в городах, в магазинах и так далее. Наша технология нетребовательна к качеству съемки и может работать даже со снимками, сделанными при плохом освещении. То есть – максимально приближена к реальным городским условиям.