Рубрики Блоги

Facebook разрабатывает ИИ, который облегчит просмотр видео людям с ограниченными возможностями

Опубликовал Кирилл Иртлач

Видеоролики давно стали основным контентом социальных сетей. Однако не все пользователи в силу физических ограничений могут полноценно их использовать. Помочь таким людям призвана система VideoStory, над которой сейчас работают в Facebook.

В основе системы лежит нейросеть, которая анализирует видео и генерирует к нему подробное описание, позволяющее понять, что именно происходит на экране.

Разработчики отмечают, что ИИ обучили на 20 тысячах «популярных видеороликов» из социальных сетей, а также 123 тысячах описательных предложений. Кроме того, исследователи уделили особое внимание способности нейросети понимать контекст, чтобы она могла учитывать связь между прошлыми и будущими событиями на видео.

Как признают в самой Facebook, хотя система уже умеет генерировать описания, зачастую ее предложения воспроизводят происходящее на экране недостаточно качественно:

Когда исследователи показали ИИ видео с ребенком, играющим с собаками, нейросеть в большинстве случаев рассказывала о собаках, но не упоминала малыша.

Тем не менее, добавляют разработчики, VideoStory служит хорошим ориентиром для создания полноценной системы описания видеоконтента.

Отметим, что на данный момент проект не заявлен как коммерческий, также неизвестно, когда он выйдет в качестве готового приложения.

«Видеоконтент в социальных сетях сегодня является неотъемлемой частью общения между пользователями, — прокомментировали разработку исследователи. — Вместе с тем, если человек в силу обстоятельств не может просматривать видео, это существенно ограничивает его коммуникативные возможности. Система, описывающая происходящее на экране, так или иначе позволит восполнить этот пробел».

Источники: tproger, Venture Beat