Google DeepMind представляє ШІ Genie 3: створюйте інтерактивні світи — Google DeepMind представляє Genie 3

Google DeepMind анонсувала Genie 3 — нову версію універсальної моделі штучного інтелекту, яка здатна створювати повноцінні інтерактивні віртуальні середовища просто на основі текстового опису. На відміну від попередньої версії, нова модель генерує світ із високою швидкістю — у реальному часі з частотою 24 кадри на секунду та роздільною здатністю 720p.

Що вміє Genie 3

Модель дозволяє створювати динамічні середовища, які виглядають і поводяться максимально наближено до реальності. Серед можливостей — реалістична поведінка води, освітлення, взаємодія об’єктів у просторі, а також моделювання екосистем: з детальними звичками тварин і ростом рослин.

Крім того, Genie 3 підтримує вигадане світотворення. Можна створювати анімованих персонажів, фантастичні локації чи історичні епохи з високою візуальною точністю та глибиною занурення.

Інженери DeepMind зазначають, що модель враховує попередні кадри під час генерації нових, формуючи своєрідну “візуальну пам’ять”. Це дозволяє середовищу залишатись стабільним та логічно послідовним протягом кількох хвилин, а зміни у просторі виглядають природно й не випадково. Пам’ять Genie 3 охоплює до хвилини візуальної історії, що для такого типу моделей — суттєвий прорив.

Попри дивовижні можливості, Genie 3 ще не позбавлена недоліків:

Обмежена свобода дій — хоча світ реагує на запити, не всі події виконує сам “агент”, тобто віртуальний учасник.
Складність взаємодії кількох агентів — моделювання поведінки кількох незалежних об’єктів в одному середовищі поки залишається проблемою.
Недостатня географічна точність — створені локації не збігаються з реальними місцями з геоданих.
Проблеми з рендерингом тексту — написані елементи інтерфейсу або написи часто виглядають нечітко, якщо не задані явно.
Час взаємодії — поки що модель підтримує лише кілька хвилин безперервної взаємодії.

На цей час модель Genie 3 доступна лише для обмеженого кола дослідників та творців. Google планує в майбутньому поступово розширити доступ для тестування.

Genie 3 — це ще один крок до інтерактивного, візуального штучного інтелекту, який може стати основою для нових форматів ігор, навчання, дизайну та симуляцій. Модель поєднує генеративний ШІ з фізикою, біологією й елементами оповіді, відкриваючи новий рівень творчої свободи. Якщо технологія зможе масштабуватись і подолати поточні обмеження, вона потенційно змінить підхід до створення віртуального контенту — від розваг до наукового моделювання.

Джерело: neowin