Google Photo совсем недавно научился группировать изображения по объектам, однако в Microsoft пошли дальше и разработали систему, определяющую не только несколько объектов на фотографии, но и описывающую это языком, приближенным к обычному человеческому.
Сначала алгоритм находит все, что может идентифицировать на изображении, а потом генерирует из получившихся слов предложения таким образом, чтобы описать взаимодействие предметов.
Например:
После этого предложения анализируются на логичность и алгоритм выбирает наиболее вероятный вариант. В данном случае — женщина держит камеру в толпе.
Работая над этим проектом, в Microsoft хотят получить хотя бы частичные возможности искусственного интеллекта. В данном случае, возможность лингвистически интерпретировать визуальные образы.
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.