Новости Технологии 06.04.2023 в 14:32 comment views icon

Meta создала SAM — новую ИИ-модель, которая идентифицирует объекты на изображениях и видео через подсказки пользователя

author avatar
https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg

Катерина Даньшина

Автор новостей

Meta создала SAM — новую ИИ-модель, которая идентифицирует объекты на изображениях и видео через подсказки пользователя

Раздел Технологии выходит при поддержке Favbet Tech

SAM (Segment Anything Model) – это модель сегментации изображений от Meta, которая может реагировать на пользовательские подсказки (текстовые или указанные курсором), чтобы идентифицировать определенные объекты на изображении или видео, даже если она не сталкивалась с ними во время обучения.

Сегментация изображения – это процесс разделения цифрового изображения на несколько сегментов, которые используется для облегчения его анализа и обработки. Обычно для создания точной модели сегментации необходимы высокоспециализированные технические эксперты, доступ к инфраструктуре обучения ИИ и большим объемам тщательно аннотированных данных в домене. SAM призвана «демократизировать» этот процесс, что будет способствовать успешным дальнейшим исследованиям компьютерного зрения.

Meta считает, что ее технология будет полезна для понимания содержимого веб-страниц, приложений дополненной реальности, редактирования изображений, а также в научных исследованиях (для автоматической локализации животных или объектов на видео).

В дополнение к инструменту Meta собрала набор данных «SA-1B», содержащий 1 миллион изображений, лицензируемых «большой фотокомпанией», и 1,1 миллиарда масок сегментации, созданных ее моделью. Meta сделает SAM и ее набор данных доступным для исследовательских целей по лицензии Apache 2.0.

В настоящее время код доступен на GitHub, также можно опробовать бесплатную интерактивную демонстрацию технологии сегментации Meta. Пользователи могут загрузить снимок и использовать функции Hover & Click (выбор объектов с помощью мыши), Box (выбор объектов в поле выбора) или Everything (автоматическая идентификация каждого объекта на изображении).

  • Напомним, что в январе Meta выпустила свою языковую модель ИИ LLaMA – как пакет с открытым исходным кодом, доступ к которому могут получить члены ИИ-сообщества. Однако через неделю после того, как компания начала принимать запросы, торрент для загрузки языковой модели появился на сайте 4chan, а впоследствии распространился в других сообществах.

Источник: Ars Technica

Раздел Технологии выходит при поддержке Favbet Tech

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: