Facebook открыла исходники своего ПО для сегментации изображений, основанного на искусственном интеллекте

Опубликовал Володимир Скрипін

Компания Facebook официально объявила о своем решении перенести все свои программные наработки в области систем искусственного интеллекта в категорию Open Source. DeepMask, SharpMask и MultiPathNet – эти инструменты уже опубликованы на GitHub под лицензией BSD.

Многие наверняка до этого и знать и не знали о существовании этих проектов, в чем, в принципе, нет ничего удивительного, учитывая их узкую специализацию, но они существует уже относительно давно. Соответствующие научные работы можно найти на сайте arXiv.org (1, 2 и 3). Дабы помочь составить максимально полную картину о вышеупомянутых разработках команда Facebook AI Research (FAIR) не поленилась и подготовила серьезную по объемам публикацию своем официальном блоге.

Сегментация изображений уже давно выходит за рамки простых задач распознавания людей, объектов или предметов на фотографиях, или даже определения их точного местоположения в пределах изображения. Ее суть в вычленении каждого отдельного пикселя и выделении пикселей с общими визуальными характеристиками с целью упрощения и/или изменения представления изображения. Это весьма сложный и трудоемкий процесс, который требует использования глубинного обучения, своеобразной формы искусственного интеллекта, как правило, подразумевающего обучение искусственных нейронных сетей на огромных массивах данных для дальнейшего поиска определенных закономерностей и связей в новых наборах данных.

В случае Facebook упомянутые инструменты – последовательно соединенные елементы одной системы. Как объясняет научный сотрудник FAIR Петр Доллáр, «DeepMask создает начальные образы объектов, SharpMask обрабатывает эти образы, а MultiPathNet распознает объекты, по каждому из образов».

К слову, это уже не первый раз, когда Facebook делает свои ИИ-системы доступными для широких масс. В июне соцсеть поступила аналогичным образом по отношению к Torchnet.

На сегодняшний день множество компаний выделяют огромные денежные и человеческие ресурсы на проекты в области глубокого обучения. В их числе такие именитые технологические гиганты, как Apple, Baidu, Google и Microsoft. Эти компании наряду с независимыми научно-исследовательскими лабораториями постоянно соревнуются между собой в конкурсах на лучшую систему обработки изображений вроде COCO. Более высокая продуктивность команды FAIR в будущем может вылиться в более качественные приложения, которые смогут привлечь больше пользователей и большие объемы данных.

Источник: VB