Підрозділ Google DeepMind розробив модель штучного інтелекту Genie, яка здатна трансформувати зображення у відео ігри. Вона дозволяє створювати ігрові світи для платформерів всього за кілька простих дій.

Модель Genie відносно невелика ─ з 11 млрд параметрів. Вона навчена на більш ніж 200 тис. годинах відео проходження двомірних платформерів людьми. Такі ігри досить шаблонні, тож не дивно, що Genie з’ясувала пов’язану з ними механіку та фізику дій. Навчання виявилось досить ефективним навіть попри те, що відеопотоки не містили інформації про те, коли було натиснуто кнопку чи елемент керування.

Як наслідок, Genie приймає одне зображення (фотографію, ескіз чи зображення, створене штучним інтелектом) і перетворює його на гру, у яку можна грати, реагуючи на елементи керування користувача. Фактично зображення трансформується в рудиментарне інтерактивне середовище за один крок.

I am really excited to reveal what @GoogleDeepMind's Open Endedness Team has been up to 🚀. We introduce Genie 🧞, a foundation world model trained exclusively from Internet videos that can generate an endless variety of action-controllable 2D worlds given image prompts. pic.twitter.com/TnQ8uv81wc

— Tim Rocktäschel (@_rockt) February 26, 2024