Рубрики Новости

Искусственный интеллект DALL-E по генерации изображений из текста научили редактировать фотографии

Опубликовал
Максим Григор'єв

Дебютировавший в 2021 году искусственный интеллект на основе OpenAI получил обновление. Теперь DALL-E, который преобразовывал текст в изображения, может редактировать уже существующие фотографии.

Для редактирования ИИ нужно указать область, которую следует изменить, и он может или удалить объект, или поместить вместо него другой. Как пример разработчики приводят фотографию комнаты с бассейном, и DALL-E добавляет надувной круг в виде фламинго, учитывая даже тени в комнате.

Другое новшество – инструмент создания изображения из нескольких. Пользователи могут загрузить начальное изображение и создать несколько похожих на него вариантов. Алгоритм может смешивать несколько изображения, создавая одну из элементов обоих. DALL-E создает сгенерированные изображения размером 1024×1024 пикселя, хотя в первоначальном варианте ИИ создавались картинки с 256×256 пикселями.

Онлайн-курс "Проджект-менеджер в ІТ" від Laba.
Навчіться запускати, контролювати й успішно реалізовувати ІТ-проєкти. Пройти весь шлях проєктного управління на реальному кейсі вам допоможе PMD із 19-річним досвідом в ІТ.
Детальніше про курс

DALL-E основан на CLIP, системе компьютерного зрения, которую OpenAI также анонсировала в прошлом году.

«Первый вариант ИИ просто брал подход GPT-3 из языка и применял его для создания изображения: мы сжали изображения в набор слов и научились предсказывать, что будет дальше».

Ученый-исследователь OpenAI Прафулла Дхаривал

Полная модель DALL-E никогда не публиковалась, но разработчики могут зарегистрироваться, чтобы протестировать систему. В OpenAI надеются позже сделать ее доступной для использования в сторонних приложениях.

 

 

Disqus Comments Loading...