Рубрики Блоги

Microsoft научила компьютер описывать фотографии

Опубликовал Андрей Белокриницкий

 

Google Photo совсем недавно научился группировать изображения по объектам, однако в Microsoft пошли дальше и разработали систему, определяющую не только несколько объектов на фотографии, но и описывающую это языком, приближенным к обычному человеческому.

Сначала алгоритм находит все, что может идентифицировать на изображении, а потом генерирует из получившихся слов предложения таким образом, чтобы описать взаимодействие предметов.

Например:

  • Фиолетовая камера с женщиной
  • Женщина держит камеру в толпе
  • Женщина держит кота

После этого предложения анализируются на логичность и алгоритм выбирает наиболее вероятный вариант. В данном случае — женщина держит камеру в толпе.

Работая над этим проектом, в Microsoft хотят получить хотя бы частичные возможности искусственного интеллекта. В данном случае, возможность лингвистически интерпретировать визуальные образы.

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.