Рубрики Новости

ИИ DeepMind AlphaStar разгромил профессиональных игроков StarCraft II со счётом 10-1

Опубликовал
Вадим Карпусь

Система искусственного интеллекта AlphaStar, разработанная специалистами подразделения Google DeepMind, продемонстрировала впечатляющие результаты в поединке с профессиональными игроками StarCraft II. Система AlphaStar смогла одержать 10 побед подряд TLO и MaNa в двух отдельных сериях из пяти игр, которые первоначально проходили в декабре. После 10 поражений  профессионалы, наконец, одержали победу над ИИ, когда MaNa сыграл с AlphaStar в поединке, который Blizzard и DeepMind демонстрировали в режиме реального времени.

Сражения между игроками и AlphaStar велись на карте Catalyst в слегка устаревшей версии StarCraft II, которая была разработана для проведения исследований ИИ. Хотя TLO заявил во время трансляции, что он уверен, что сможет победить ИИ, система AlphaStar смогла одержать победы во всех пяти играх, каждый раз демонстрируя совершенно уникальные стратегии.

Однако следует отметить, что у AlphaStar было небольшое преимущество перед TLO. Во-первых, в матче использовалась раса протоссов, которая не является предпочтительной для TLO. Кроме того, AlphaStar видит игру не так, как обычный игрок. Хотя ИИ ограничен в обзоре туманом войны, он «видит» всю карту полностью. Это означает, что AlphaStar может одновременно обрабатывать информацию о собственной базе, а также о вражеских юнитах, не скрытых туманом войны. Человеку такая возможность недоступна, ему нужно перемещаться по карте, чтобы видеть происходящее на различных её участках.

Вместе с тем, у AlphaStar не было преимуществ, которые можно предположить у ИИ по сравнению с человеком. В то время как TLO и MaNa теоретически ограничены в количестве кликов, которые они могут физически совершать в минуту, в отличие от ИИ, AlphaStar фактически выполнял меньше действий в минуту, чем его оппонент-человек, и значительно меньше, чем использовал бы средний профессиональный игрок. Для ИИ также было установлено время реакции около 350 миллисекунд, что медленнее, чем у большинства профессионалов. Хотя ИИ не торопился, он мог принимать более разумные и эффективные решения, которые давали ему преимущество.

Онлайн курс з промт інжинірингу та ефективної роботи з ШІ від Powercode academy.
Курс-інтенсив для отримання навичок роботи з ChatGPT та іншими інструментами ШІ для професійних та особистих задач, котрі допоможуть як новачку, так і професіоналу.
Записатися на курс

Отметим, опыт AlphaStar в игре основан на углубленной программе обучения, которую DeepMind называет AlphaStar League. В DeepMind использовали различные повторы игр людей и тренировали нейронную сеть на основе этих данных. Этот агент, основанный на человеческих игровых данных, был разветвлён для создания новых игроков, а уже затем эти конкуренты сравнивались друг с другом в серии матчей. Этим версиям предстояло принять специализацию и освоить различные части игры, чтобы создать уникальный игровой опыт. Программа AlphaStar League работала неделю и по результатам каждого матча генерировала новую информацию, которая позволяла оттачивать стратегию ИИ. За эту неделю было сыграно столько матчей, что обычному игроку для этого потребовалось бы 200 лет. В конце недельного сезона в DeepMind выбрали 5 индивидуальных агентов, которые использовали наименее вероятные стратегии и обладали наибольшими шансами на победу. Эти агенты использовались в 5 матчах против TLO, которые завершились победой ИИ.

Видя, что ИИ удалось превзойти профессионального игрока, в DeepMind решили выставить AlphaStar против эксперта по протосам – игрока MaNa, который является двукратным чемпионом крупных турниров StarCraft II. Система AlphaStar прошла ещё одну неделю тренировок перед соревнованиями, включая знания, полученные в рамках сражений с TLO. Комментаторы отметили, что ИИ в своих матчах значительно больше походил на человека, используя более беспорядочные и неожиданные действия, одновременно корректируя процесс принятия решений и стиль. Как и в случае с TLO, MaNa старался изо всех сил, но не смог победить ни в одном из 5 матчей против агентов AlphaStar. Таким образом, общий счёт соревнования составил 10-0.

Затем состоялся ещё один матч в режиме реального времени. В нём использовалась новая версия AlphaStar, которая не могла видеть всю карту сразу. В результате, агент принимал решения, основываясь на доступной информации, на которой он сфокусирован в текущий момент – как этот делал бы человек. Эта версия не тестировалась с другими профессиональными игроками перед матчем с MaNa. Благодаря тому, что у AlphaStar был ограниченный обзор, MaNa смог воспользоваться некоторыми слабостями ИИ и одержать первую и пока единственную победу.

Источник: Engadget

Disqus Comments Loading...