«Жутко и чересчур хорошо». Нейросеть Midjourney после обновления V5 генерирует еще более реалистичные изображения, и наконец — с 5 пальцами на руках

Опубликовал
Катерина Даньшина

В среду Midjourney анонсировала запуск новой версии своего ИИ-сервиса для синтеза изображений, который может создавать реалистичные результаты с высоким качеством – пользователи уже обозвали их «жуткими и слишком идеальными».

Midjourney V5 доступна как альфа-версия для подписчиков сервиса через Discord.

«Ощущение, что Midjourney наконец-то надел очки, после того, как долго игнорировал свое плохое зрение. Я вижу все в формате 4K – это невероятно», – говорит графический дизайнер Джули Уилланд.

Курс-професія "Junior Data Analyst" від robot_dreams.
Комплексний курc для всіх, хто хоче опанувати нову професію з нуля.На прикладі реальних датасетів ви розберете кожен етап аналізу даних.
Програма курсу і реєстрація

Уилланд поделилась некоторыми изображениями, сгенерированными с помощью Midjourney V5 — и они, безусловно, демонстрируют большой прогресс в детализации с момента появления сервиса в марте 2022 года.

Midjourney V3 дебютировала в августе, а V4 – в ноябре. Каждая итерация добавляла все больше деталей к сгенерированным результатам, что видно на этих примерах:

Сравнение изображений, сгенерированных Midjourney V3 (слева), V4 (в центре) и V5 (справа) с текстовой подсказкой «мускулистый варвар с оружием у кинескопного телевизора, кинематограф, 8K, студийное освещение». Источник: Arstechnica

Midjourney работает подобно Stable Diffusion и DALL-E, и генерирует изображения на основе текстовых подсказок, используя ИИ-модель, которая училась на миллионах произведений искусства, созданных человеком. Недавно Midjourney попала в скандал за несоблюдение авторских прав из-за комиксов, которые использовали предыдущие версии сервиса.

Поэкспериментировав с Midjourney V5 в течение дня, Уилланд отметила улучшения, включающие «невероятно реалистичные» текстуры кожи и черты лица; кинематографическое освещение; лучшие блики и тени; более четкие ракурсы или обзор сцены, а также «почти идеальные глаза». Ну и конечно руки.

В течение последнего года возникало немало обсуждений относительно того, как нейросети отображают пальцы на руках – вместо предыдущих 7-10, Midjourney V5 пока все время предоставляла правильные результаты с 5-ю.

Midjourney отмечает, что V5 теперь соответствует «намного более широким стилистическим диапазонам», чем предыдущая версия, а также более чувствительна к подсказкам и предлагает 2-кратное увеличение разрешения изображения.

Источник: Arstechnica

Disqus Comments Loading...