Midjourney та DALL-E, посуньтеся: Google створив Transframer — генеративну нейромережу, яка здатна генерувати короткі відео за єдиним зображенням

Опубликовал
Олександр Швець

Команда Google оголосила про створення Transframer — нової програми, здатної генерувати короткі відеоролики на основі окремих зображень. Ця технологія доповнить традиційні рішення для рендерингу, дозволяючи розробникам створювати віртуальні середовища на основі можливостей машинного навчання.

Програму назвали на честь іншої моделі на основі штучного інтелекту, відомої як Transformer. Transformer — це нова архітектура нейронної мережі, здатна генерувати текст шляхом моделювання та порівняння інших слів у реченні. Модель була створена у 2017 році й відтоді використовувалася в стандартних середовищах глибокого навчання, таких як TensorFlow та PyTorch.

Так само як Transformer використовує мову для прогнозування потенційних результатів, Transframer використовує зображення у поєднанні з описом запиту для створення коротких відео.

Для роботи Transframer використовує платформи штучного інтелекту Google DeepMind. Технологія аналізує одне зображення для отримання його ключових фрагментів та створення додаткових зображень. Потім контекстні зображення використовуються для подальшого прогнозування того, як зображення виглядатиме під різними кутами.

Онлайн курс з промт інжинірингу та ефективної роботи з ШІ від Powercode academy.
Курс-інтенсив для отримання навичок роботи з ChatGPT та іншими інструментами ШІ для професійних та особистих задач, котрі допоможуть як новачку, так і професіоналу.
Записатися на курс

 

Окрім можливості генерувати відео на основі дуже обмеженого набору даних, Transframer також добре проявив себе в інших завданнях і тестах, пов’язаних з відео: семантичній сегментації, класифікації зображень та прогнозуванні оптичного потоку.

Раніше повідомлялося, що Google оновлює Пошук, щоб ефективніше боротися з клікбейтом і віддавати перевагу реальним відгукам.

Джерело: TechSpot

Disqus Comments Loading...