Блоги
Facebook разрабатывает ИИ, который облегчит просмотр видео людям с ограниченными возможностями

Facebook разрабатывает ИИ, который облегчит просмотр видео людям с ограниченными возможностями

Facebook разрабатывает ИИ, который облегчит просмотр видео людям с ограниченными возможностями

Видеоролики давно стали основным контентом социальных сетей. Однако не все пользователи в силу физических ограничений могут полноценно их использовать. Помочь таким людям призвана система VideoStory, над которой сейчас работают в Facebook.

В основе системы лежит нейросеть, которая анализирует видео и генерирует к нему подробное описание, позволяющее понять, что именно происходит на экране.

Разработчики отмечают, что ИИ обучили на 20 тысячах «популярных видеороликов» из социальных сетей, а также 123 тысячах описательных предложений. Кроме того, исследователи уделили особое внимание способности нейросети понимать контекст, чтобы она могла учитывать связь между прошлыми и будущими событиями на видео.

Facebook разрабатывает ИИ, который облегчит просмотр видео людям с ограниченными возможностямиКак признают в самой Facebook, хотя система уже умеет генерировать описания, зачастую ее предложения воспроизводят происходящее на экране недостаточно качественно:

Facebook разрабатывает ИИ, который облегчит просмотр видео людям с ограниченными возможностями
Когда исследователи показали ИИ видео с ребенком, играющим с собаками, нейросеть в большинстве случаев рассказывала о собаках, но не упоминала малыша.

Тем не менее, добавляют разработчики, VideoStory служит хорошим ориентиром для создания полноценной системы описания видеоконтента.

Отметим, что на данный момент проект не заявлен как коммерческий, также неизвестно, когда он выйдет в качестве готового приложения.

«Видеоконтент в социальных сетях сегодня является неотъемлемой частью общения между пользователями, — прокомментировали разработку исследователи. — Вместе с тем, если человек в силу обстоятельств не может просматривать видео, это существенно ограничивает его коммуникативные возможности. Система, описывающая происходящее на экране, так или иначе позволит восполнить этот пробел».

Источники: tproger, Venture Beat


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: