banner
Новини Технології 05.02.2025 comment views icon

Власник TikTok представ OmniHuman-1 — генератор відео «оживить» фото за аудіотреком

author avatar

Андрій Русанов

Редактор новин

Власник TikTok представ OmniHuman-1 — генератор відео «оживить» фото за аудіотреком
Ілюстрація роботи OmniHuman-1 / ByteDance

Китайський технологічний гігант ByteDance, який володіє TikTok, представив штучний інтелект для створення відео OmniHuman-1. Модель дуже реалістична, попри деякі нюанси.

У демонстраційних відео модель згенерувала вигаданий епізод TED Talk, лекцію Ейнштейна, прочитану ним самим, та привітання леді похилого віку з келихом вина. Людські руки вийшли не надто вдало, як це часто буває у генеративних моделей, але загалом, схоже, OmniHuman-1 робить ставку на реалізм.

Щоб створити відео, моделі достатньо надати лише одне фото та аудіозапис. Серед можливостей ШІ — редагування відео, зміни рухів тіла та жестів. OmniHuman-1 навчалася на 18700 годинах відеоданих із використанням підходу «усі умови», який дозволяє одночасне навчання з кількох джерел введення: тексту, аудіо, відео тощо. Дослідники ByteDance кажуть, що широкий діапазон навчальних даних допомагає ШІ «суттєво зменшити втрату даних» порівняно зі старішими моделями для створення deepfake.

Зараз китайські компанії форсують створення різноманітних моделей ШІ, зокрема мовних та генеративних. Минулого року ще один гігант, Tencent, представив генеративну модель HunyuanVideo, яка демонструє чудові відео, але не здається такою ж реалістичною. Також повідомлялося, про іншу розробку Tencent, модель для створення ігор GameGen-O, яка нібито навчалася на сучасних ігор.

Серед ризиків використання китайських ШІ — безпека даних, цензурованість та невпевненість у дотриманні авторських прав. Проте деякі з них, як популярна мовна модель від DeepSeek натомість пропонують невелику вартість та відкритий код. Заявлена низька вартість DeepSeek вже спровокувала падіння акцій, проте аналітики сумніваються у заявлених цифрах.

Модель ШІ DeepSeek R1 збирає безліч даних користувача та викривляє інформацію про Китай

Джерело: TechSpot

Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: