Искусственный интеллект DALL-E по генерации изображений из текста научили редактировать фотографии

Опубликовал Максим Григор'єв

07.04.2022 10:01

Дебютировавший в 2021 году искусственный интеллект на основе OpenAI получил обновление. Теперь DALL-E, который преобразовывал текст в изображения, может редактировать уже существующие фотографии.

Для редактирования ИИ нужно указать область, которую следует изменить, и он может или удалить объект, или поместить вместо него другой. Как пример разработчики приводят фотографию комнаты с бассейном, и DALL-E добавляет надувной круг в виде фламинго, учитывая даже тени в комнате.

Другое новшество – инструмент создания изображения из нескольких. Пользователи могут загрузить начальное изображение и создать несколько похожих на него вариантов. Алгоритм может смешивать несколько изображения, создавая одну из элементов обоих. DALL-E создает сгенерированные изображения размером 1024×1024 пикселя, хотя в первоначальном варианте ИИ создавались картинки с 256×256 пикселями.

DALL-E основан на CLIP, системе компьютерного зрения, которую OpenAI также анонсировала в прошлом году.

«Первый вариант ИИ просто брал подход GPT-3 из языка и применял его для создания изображения: мы сжали изображения в набор слов и научились предсказывать, что будет дальше».

Ученый-исследователь OpenAI Прафулла Дхаривал

Полная модель DALL-E никогда не публиковалась, но разработчики могут зарегистрироваться, чтобы протестировать систему. В OpenAI надеются позже сделать ее доступной для использования в сторонних приложениях.

Опубликовал Максим Григор'єв

Теги OpenAIOpenAI GPT-3Искусственный интеллект

07.04.2022 10:01

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.

Искусственный интеллект DALL-E по генерации изображений из текста научили редактировать фотографии

Читайте также