
Google анонсировал генеративную модель создания видео Veo 3 с возможностями создания аудио, инструмент для создания фильмов Flow, и Imagen 4 с улучшенным качеством картинок.
По словам Google, Veo 3 не только улучшает качество генерируемого контента по сравнению с Veo 2, но и «впервые» создает видео с соответствующим его содержания звуковым оформлением. Городская улица сможет получить шум транспорта и толпу, в лесу можно будет услышать пение птиц.
Доступны даже разговоры — на весьма неплохом уровне, как в примерах. Эта возможность включает точную синхронизацию губ. компания говорит об улучшенном понимании пользовательских подсказок.
Google Veo 3 получила не только звук, но и еще несколько новых возможностей, по сравнению с предыдущей версией. Это улучшенная работа с референсными изображениями сцен, объектов и стилей, которые будут помогать пользователю получить более точный результат в соответствии со своим замыслом. Новые элементы управления камерой помогут с вращением, масштабированием и перемещением кадра. Функция «Перерисовка» позволяет расширить кадр, изменить ориентацию изображения и приспособить видео под нужные размеры. Также доступно добавление и удаление объектов.
В США Veo 3 доступна со вчерашнего дня, для подписчиков Gemini, на тарифе Ultra, в корпоративном Vertex AI и в новом приложении Flow. Этот инструмент разработан специально для применения с моделью Veo. Он облегчает создание кинематографических клипов с сочетанием возможностей Veo, Imagen и Gemini.
«Используйте естественный язык для описания своих кадров в Flow, управляйте компонентами вашей истории — актерским составом, локациями, объектами и стилями — в одном удобном месте и используйте Flow, чтобы превратить свое повествование в красивые сцены».
Flow доступен для подписчиков тарифов планов планов Google AI Pro и Ultra в США, а вскоре и в других странах.
Генератор изображений Imagen 4 «сочетает скорость с точностью для создания потрясающих изображений». Google заявляет о «огромном шаге вперед в качестве» по сравнению с предшественницей. Улучшено воспроизведение деталей, таких как мех животных и использование стилей, как реалистичных, так и абстрактных.









Imagen 4 может создавать изображения в различных соотношениях сторон и с разрешением до 2k. Модель доступна в Gemini, Whisk, Vertex AI, а также в Slides, Videos, Docs и других инструментах в Workspace.
Источник: Google
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: