Подразделение Google DeepMind разработало модель искусственного интеллекта Genie, которая способна трансформировать изображения в видео игры. Она позволяет создавать игровые миры для платформеров всего за несколько простых действий.
Модель Genie относительно небольшая — из 11 млрд параметров. Она обучена на более чем 200 тыс. часах видео прохождения двухмерных платформеров людьми. Такие игры достаточно шаблонные, поэтому неудивительно, что Genie выяснила связанную с ними механику и физику действий. Обучение оказалось достаточно эффективным даже несмотря на то, что видеопотоки не содержали информации о том, когда была нажата кнопка или элемент управления.
Как следствие, Genie принимает одно изображение (фотографию, эскиз или изображение, созданное искусственным интеллектом) и превращает его в игру, в которую можно играть, реагируя на элементы управления пользователя. Фактически изображение трансформируется в рудиментарную интерактивную среду за один шаг.
I am really excited to reveal what @GoogleDeepMind's Open Endedness Team has been up to 🚀. We introduce Genie 🧞, a foundation world model trained exclusively from Internet videos that can generate an endless variety of action-controllable 2D worlds given image prompts. pic.twitter.com/TnQ8uv81wc
— Tim Rocktäschel (@_rockt) February 26, 2024
Пока не следует ожидать от модели высокого качества созданных игр. Genie — это исследовательский проект, а не конечный продукт. Модель была обучена на видео со сверхнизким разрешением 160×90 пикселей и частотой всего 10 кадров в секунду. Таким образом, она генерирует «игры» с таким же низким разрешением, которые работают только 16 секунд с частотой 1 кадр в секунду.
Однако базовую концепцию удалось проверить, и есть все признаки того, что Genie значительно улучшится с масштабированием. Для этого нужно только использовать более длинные видео с более высоким разрешением и дополнительные вычислительные мощности.
Источник: newatlas
Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: