Штучний інтелект на основі OpenAI, що дебютував у 2021 році, отримав оновлення. Тепер DALL-E, який перетворював текст на зображення, може редагувати фотографії.

Для редагування ШІ потрібно вказати область, яку слід змінити, і він може видалити об’єкт, або помістити замість нього інший. Як приклад, розробники наводять фотографію кімнати з басейном, і DALL-E додає надувне коло у вигляді фламінго, враховуючи навіть тіні в кімнаті.

Інше нововведення – інструмент створення зображення з кількох. Користувачі можуть завантажити початкове зображення та створити кілька схожих на нього варіантів. Алгоритм може змішувати кілька зображень, створюючи одну з елементів обох. DALL-E створює згенеровані зображення розміром 1024×1024 пікселі, хоча в початковому варіанті ШІ створювалися зображення з 256×256 пікселями.

DALL-E заснований на CLIP, системі комп’ютерного зору, яку OpenAI також анонсувала минулого року.

«Перший варіант ШІ просто брав підхід GPT-3 з мови та застосовував його для створення зображення: ми стиснули зображення в набір слів і навчилися передбачати, що буде далі».

Вчений-дослідник OpenAI Прафулла Дхарівал

Повна модель DALL-E ніколи не публікувалася, але розробники можуть реєструватися, щоб протестувати систему. В OpenAI сподіваються пізніше зробити її доступною для використання у сторонніх програмах.