Microsoft научила компьютер описывать фотографии

2015-05-28_23h22_39

 

Google Photo совсем недавно научился группировать изображения по объектам, однако в Microsoft пошли дальше и разработали систему, определяющую не только несколько объектов на фотографии, но и описывающую это языком, приближенным к обычному человеческому.

Сначала алгоритм находит все, что может идентифицировать на изображении, а потом генерирует из получившихся слов предложения таким образом, чтобы описать взаимодействие предметов.

Например:

  • Фиолетовая камера с женщиной
  • Женщина держит камеру в толпе
  • Женщина держит кота

После этого предложения анализируются на логичность и алгоритм выбирает наиболее вероятный вариант. В данном случае — женщина держит камеру в толпе.

2015-05-28_23h22_49

Работая над этим проектом, в Microsoft хотят получить хотя бы частичные возможности искусственного интеллекта. В данном случае, возможность лингвистически интерпретировать визуальные образы.