Зображення Imagen 4 / Google
Google анонсував генеративну модель створення відео Veo 3 з можливостями створення аудіо, інструмент для створення фільмів Flow, та Imagen 4 з покращеною якістю картинок.
За словами Google, Veo 3 не лише покращує якість генерованого контенту порівняно з Veo 2, але й «вперше» створює відео з відповідним його змісту звуковим оформленням. Міська вулиця зможе отримати шум транспорту та натовп, у лісі можна буде почути спів птахів.
Доступні навіть розмови — на вельми непоганому рівні, як у прикладах. Ця можливість включає точну синхронізацію губ. компанія каже про покращене розуміння користувацьких підказок.
Google Veo 3 отримала не тільки звук, але й ще кілька нових можливостей, порівняно з попередньою версією. Це покращена робота з референсними зображеннями сцен, об’єктів та стилів, які допомагатимуть користувачу отримати більш точний результат відповідно до свого задуму. Нові елементи керування камерою допоможуть з обертанням, масштабуванням та переміщенням кадру. Функція «Перемальовування» дозволяє розширити кадр, змінити орієнтацію зображення та пристосувати відео під потрібні розміри. Також доступне додавання і видалення об’єктів.
У США Veo 3 доступна відучора, для передплатників Gemini, на тарифі Ultra, у корпоративному Vertex AI та у новому застосунку Flow. Цей інструмент розроблений спеціально для застосування з моделлю Veo. Він полегшує створення кінематографічних кліпів з поєднанням можливостей Veo, Imagen та Gemini.
«Використовуйте природну мову для опису своїх кадрів у Flow, керуйте складниками вашої історії — акторським складом, локаціями, об’єктами та стилями — в одному зручному місці та використовуйте Flow, щоб перетворити свою розповідь у красиві сцени».
Flow доступний для передплатників тарифів планів Google AI Pro та Ultra у США, а незабаром і в інших країнах.
Генератор зображень Imagen 4 «поєднує швидкість із точністю для створення приголомшливих зображень». Google заявляє про «величезний крок уперед у якості» порівняно з попередницею. Покращено відтворення деталей, як хутро тварин та використання стилів, як реалістичних, так і абстрактних.
Imagen 4 може створювати зображення в різних співвідношеннях сторін та з роздільною здатністю до 2k. Модель доступна у Gemini, Whisk, Vertex AI, а також у Slides, Videos, Docs та інших інструментах у Workspace.
Джерело: Google