Искусственный интеллект AlphaZero научился играть в шахматы за четыре часа. И обыграл программу-чемпиона

AlphaGo Zero. Фото: Google

Программа AlphaZero за четыре часа обучилась игре в шахматы, после чего победила Stockfish – искусственный интеллект, который считался лучшим виртуальным шахматным игроком. Об этом говорится в научной работе, препринт которой опубликован на сайте Arxiv.

В AlphaZero внедрили только правила шахмат, но не стратегии и алгоритмы игры. Всему этому программа обучалась сама. Если раньше все шахматные программы запоминали ходы, сделанные людьми, то новое поколение интеллекта получает все навыки, играя само с собой.

Перед началом каждого хода программам давали минуту на размышления. Всего провели 100 игр. AlphaZero победила 25 раз на белых и еще 3 раза на черных. Остальные игры сыграли вничью. Навыки программы компания-создатель назвала «сверхчеловеческими».

https://www.youtube.com/watch?v=lb3_eRNoH_w

Помимо этого, Alpha Zero научили правилам сёги – японской настольной игры шахматного типа. Как и в первом случае, в программу включили только основные правила, но не загружали возможные сценарии. После двух часов обучения программа обыграла алгоритм Elmo со счетом в 90:8, еще две игры закончились вничью.

Компания DeepMind (принадлежит Google), занимающаяся разработкой искусственных интеллектов, известна своей программой AlphaGo Zero, которая обыграла несколько мировых игроков в го. Но и в матче с ней AlphaZero оказалась победителем.

DeepMind также работает над ИИ для компьютерной игры Starcraft II, в которой тоже намерена одолеть лучших мировых игроков.