banner
Новини Технології 30.09.2025 comment views icon

OmnimatteZero: технологія дозволяє прибирати фон та об’єкти на відео без попереднього навчання і в реальному часі

author avatar

Олександр Федоткін

Автор новин та статей

OmnimatteZero: технологія дозволяє прибирати фон та об’єкти на відео без попереднього навчання і в реальному часі
Генеративний підхід Omnimatte без навчання, який використовує попередньо навчені моделі дифузії відео для видалення об'єктів, вилучення та безшовної композиції шарів всього за 0,04 секунди на кадр (на графічному процесорі A100)/Dvir Samuel et al

Ізраїльські дослідники з Університету ім. Бар-Ілана розробили інноваційний метод обробки відео OmnimatteZero, який спрощує відокремлення об’єктів від фону без необхідності попереднього навчання та оптимізації.

Метод розроблений групою дослідників з кафедри комп’ютерних наук під керівництвом доктора Двіра Самуеля та професора Гала Чечика. Дослідження було присвячене відокремленню об’єктів або фігур від фону у відео зі збереженням таких складних елементів, як волосся, листя, тіні, відблиски, дим або брижі на воді. 

OmnimatteZero: технологія дозволяє прибирати фон та об’єкти на відео без попереднього навчання і в реальному часі
Стратегія видалення об’єктів в OmnimatteZero/Dvir Samuel et al

Сучасні методи розділення шарів у відео покладаються на моделі штучного інтелекту, які мають навчатись на мільйонах прикладів та складних методах оптимізації. Результати дослідження групи ізраїльських науковців демонструють, що тих самих результатів можна досягти зі значно меншими зусиллями, обчислювальними, фінансовими та енергетичними витратами.

“У системах розкладання відео алгоритм повинен визначати ефекти, які об’єкт накладає на сцену, а потім видаляти або вилучати їх таким чином, щоб вони виглядали природно. Досі кожен метод вимагав мільйонів прикладів для навчання моделі, а також дуже великої обчислювальної потужності та енергії. Навіть після того, як модель була повністю навчена і готова до використання, її запуск для досягнення бажаного результату все ще міг зайняти кілька хвилин для декількох секунд відео”, — зазначає Двір Самуель. 

Такий підхід дозволяє використати контент повторно. Наприклад лебедя можна вилучити з озера разом з його відображенням і обережно інтегрувати у новий фон, а саме озеро без лебедя використати як фон для іншої сцени.

Результати дослідження переконливо довели, що для розділення шарів у відео не потрібні спеціалізовані моделі на базі ШІ та надзвичайно високі обчислювальні потужності. Для цього методу цілком достатньо наявних моделей з генерації відео, як от WAN або Veo 3. Дослідження демонструє, як генеративні відеомоделі можуть бути використані для виявлення ефектів, створюваних об’єктами, а також для видалення, вилучення та повторної вставки цих об’єктів та їхніх ефектів в інші відео в режимі реального часу.

Такий підхід буде цікавим для відеоредакторів, дизайнерів, творців контенту, рекламодавців та дослідників з області штучного інтелекту. Декілька університетських команд по всьому світу зараз працюють над удосконаленням OmnimatteZero. Наступним напрямом досліджень доктора Семюеля стане синхронізація звуку. 

Результати дослідження опубліковані на сервері препринтів arXiv

Джерело: TechXplore

Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: