Новини Софт 08.02.2024 о 11:45 comment views icon

Apple створила модель штучного інтелекту для редагування фотографій за допомогою текстових підказок

author avatar
https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg

Вадим Карпусь

Автор новин

Розділ Технології виходить за підтримки Favbet Tech

Дослідники Apple розробили нову модель штучного інтелекту, яка дозволяє користувачам простою мовою описувати те, що вони хочуть змінити на фотографії. При цьому коригувати зображення можна навіть не торкаючись програмного забезпечення для редагування фотографій.

Модель MGIE (MLLM-Guided Image Editing), над якою Apple працювала спільно з Каліфорнійським університетом у Санта-Барбарі, дозволяє обрізати, змінювати розмір, перевертати та додавати фільтри до зображень за допомогою текстових підказок. Ця модель також може бути використана для більш складних завдань редагування зображень, таких як зміна певних об’єктів на фотографії, щоб надати їм іншу форму або зробити їх яскравішими.

MGIE поєднує два різних типи використання мультимодальних мовних моделей. По-перше, вона вчиться інтерпретувати підказки користувача. Потім вона «уявляє», як виглядатиме редагування (наприклад, запит на більш синє небо на фотографії призводить до збільшення яскравості частини зображення з небом).

Apple создала модель искусственного интеллекта для редактирования фотографий с помощью текстовых подсказок

Під час редагування фотографії за допомогою MGIE користувачам потрібно просто надрукувати те, що вони хочуть змінити в зображенні. Наприклад, при редагуванні зображення піци пепероні можна набрати підказку «зроби її здоровішою», і модель додасть овочеві начинки. Фотографія тигрів у Сахарі виглядає темною, але після того, як моделі сказали «додати більше контрасту, щоб імітувати більше світла», зображення стало яскравішим.

«Замість коротких, але двозначних вказівок MGIE виявляє явні візуальні наміри і призводить до розумного редагування зображень», – йдеться у статті дослідників.

Apple надала MGIE для завантаження через GitHub, а також випустила веб-демонстрацію Hugging Face Spaces. У компанії не уточнили своїх подальших планів щодо цієї моделі.

Онлайн-курс "Маркетолог" від Laba.
Пройдіть повний шлях розробки маркетингових стратегій на практиці та з фідбеком від CEO бренд-маркетингової агенції.
Програма курсу і реєстрація

Джерело: The Verge

Розділ Технології виходить за підтримки Favbet Tech

Favbet Tech – це ІТ-компанія зі 100% українською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологій та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців. IT-компанія входить у групу компаній FAVBET.


Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: