
Фото: Unsplash.com
За последние несколько лет разработчики машинного обучения для ИИ поняли, что лучше больших данных (big data) могут быть только хорошие данные. Пионер машинного обучения Эндрю Ын недавно запустил кампанию Landing AI, призывающую коллег переключить внимание с моделей обучения и алгоритмов на качество данных, используемое для тренировки этих моделей. Суть в том, что небольшие объемы правильных, чисто маркированных данных способны улучшить работу системы ИИ в большей степени, чем в 10 раз больший объем «неочищенных» данных или даже более совершенный алгоритм.
Например, компания Affectiva, лидер в сфере «эмоционального» искусственного интеллекта, создает системы, которые помогают машинам понимать эмоции или когнитивные состояния человека. Один из ее проектов помогает автопроизводителям создавать умные помощники водителя, которые способны распознавать, когда человек засыпает за рулем. Но снимать показания с тысяч испытуемых, сидящих в автомобильных симуляторах, довольно дорого и занимает много времени. Тогда Affectiva обращается в такие стартапы как Datagen или Synthesis AI, которые генерирует синтетических людей, а точнее – 3D-модели лиц высокого разрешения.
Чтобы "синтезировать" видео засыпающего за рулём человека, нужно либо обучить модель (то есть снять десятки тысяч часов реальных людей за рулём и скормить это синтезирующей модели), либо придумать, какие мышцы лица и как изменяются при засыпании, но это не гарантирует точности распознавания в боевых условиях.
Так и наблюдение за живыми людьми имеет массу погрешностей и неточностей и также ничего не гарантирует. Тут вопрос в том, какой метод даёт больше «гарантий». Синтетический метод, как я понимаю, основан на моделировании по известным законам. Например, известно, какой компонент вырабатывается в организме при усталости и как он взаимодействует с мышцами, вызывая закрытие век. На основе этих знаний создается модель, которая воспроизводит этот процесс. В отличие от реального человека модель можно использовать 24 часа в сутки семь дней в неделю, можно разглядывать с любого ракурса и т.п. В этом основное преимущество. Точность результатов зависит от точности модели, а она зависит от полноты знаний о явлении. Чем лучше мы знаем физику и химию явления, тем точнее модель.