Рубрики Новини

Штучний інтелект DALL-E для генерації зображень із тексту навчили редагувати фотографії

Опубликовал
Максим Григор'єв

Штучний інтелект на основі OpenAI, що дебютував у 2021 році, отримав оновлення. Тепер DALL-E, який перетворював текст на зображення, може редагувати фотографії.

Для редагування ШІ потрібно вказати область, яку слід змінити, і він може видалити об’єкт, або помістити замість нього інший. Як приклад, розробники наводять фотографію кімнати з басейном, і DALL-E додає надувне коло у вигляді фламінго, враховуючи навіть тіні в кімнаті.

Інше нововведення – інструмент створення зображення з кількох. Користувачі можуть завантажити початкове зображення та створити кілька схожих на нього варіантів. Алгоритм може змішувати кілька зображень, створюючи одну з елементів обох. DALL-E створює згенеровані зображення розміром 1024×1024 пікселі, хоча в початковому варіанті ШІ створювалися зображення з 256×256 пікселями.

Онлайн-курс "PR Basis" від Skvot.
Дізнайся нюанси різних сфер і обрери свою.Як результат — матимеш стратегію бренду у своєму портфоліо та зможеш стартувати в піарі. Інсайтами ділиться лекторка, яка має 9+ років досвіду.
Детальніше про курс

DALL-E заснований на CLIP, системі комп’ютерного зору, яку OpenAI також анонсувала минулого року.

«Перший варіант ШІ просто брав підхід GPT-3 з мови та застосовував його для створення зображення: ми стиснули зображення в набір слів і навчилися передбачати, що буде далі».

Вчений-дослідник OpenAI Прафулла Дхарівал

Повна модель DALL-E ніколи не публікувалася, але розробники можуть реєструватися, щоб протестувати систему. В OpenAI сподіваються пізніше зробити її доступною для використання у сторонніх програмах.

Disqus Comments Loading...