Во время проведения конференции Next Cloud представители Google рассказали о нынешних и грядущих решениях в сфере искусственного интеллекта, над которыми работают в компании. Среди прочего была продемонстрирована работа Video Intelligence API, который позволяет идентифицировать объекты в видео.

Благодаря этому видеоролики также становятся объектами, поддающимися поиску исходя из внутреннего содержания, а не только внешних текстовых атрибутов. Например, в одном из демонстрационных роликов искусственный интеллект смог определить появившуюся в кадре таксу. Также была продемонстрирована возможность поиска по слову «пляж», после введения поискового запроса выводились ролики, где были сцены с пляжами. При этом выводилась информация о метках времени, когда в кадре появляется искомый объект. Ранее компьютеры не могли «понимать» контент видео. Поиск осуществлялся лишь на основании текстовых заголовков, ключевых слов, описаний. И, если в текстовых мета данных не было слова «пляж», хотя в самом ролике пляж присутствовал, то данный ролик не фигурировал в соответствующей поисковой выдаче.

Video Intelligence API будет доступным для сторонних разработчиков, как и другие API Google на базе технологии машинного обучения.

Источник: The Verge

Отметим, подобная функция поиска объектов на основании оценки контента применяется в сервисе Google Photos. Сервис позволяет находить и группировать фотографии по определённым темам или объектам, например, «Автомобили», «Памятники», «Цветы», «Пляжи» и др.