Новости Софт 08.02.2024 в 11:45 comment views icon

Apple создала модель искусственного интеллекта для редактирования фотографий с помощью текстовых подсказок

author avatar
https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg

Вадим Карпусь

Автор новостей

Раздел Технологии выходит при поддержке Favbet Tech

Исследователи Apple разработали новую модель искусственного интеллекта, которая позволяет пользователям простым языком описывать то, что они хотят изменить на фотографии. При этом корректировать изображения можно даже не прикасаясь к ПО для редактирования фотографий.

Модель MGIE (MLLM-Guided Image Editing), над которой Apple работала совместно с Калифорнийским университетом в Санта-Барбаре, позволяет обрезать, изменять размер, переворачивать и добавлять фильтры к изображениям с помощью текстовых подсказок. Эта модель также может применяться для более сложных задач редактирования изображений, таких как изменение определенных объектов на фотографии, чтобы придать им другую форму или сделать их ярче.

MGIE сочетает в себе два различных типа использования мультимодальных языковых моделей. Во-первых, она учится интерпретировать подсказки пользователя. Затем она «воображает», как будет выглядеть редактирование (например, запрос на более синее небо на фотографии приводит к увеличению яркости части изображения с небом).

Apple создала модель искусственного интеллекта для редактирования фотографий с помощью текстовых подсказок

При редактировании фотографии с помощью MGIE пользователям просто нужно напечатать то, что они хотят изменить в изображении. Например, при редактировании изображения пиццы пепперони можно набрать подсказку «сделай ее более здоровой», и модель добавит овощные начинки. Фотография тигров в Сахаре выглядит темной, но после того, как модели сказали «добавить больше контраста, чтобы имитировать больше света», изображение стало ярче.

«Вместо кратких, но двусмысленных указаний MGIE выявляет явные визуальные намерения и приводит к разумному редактированию изображений», — говорится в статье исследователей.

Apple предоставила MGIE для скачивания через GitHub, а также выпустила веб-демонстрацию Hugging Face Spaces. В компании не уточнили своих дальнейших планов в отношении этой модели.

Python с нуля.
Навчимо самостійно писати код на Python з нуля, розуміти структуру вебпрограм. Отримайте навички — інтеграції з сторонніми сервісами!
Дізнатись про курс

Источник: The Verge

Раздел Технологии выходит при поддержке Favbet Tech

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: