«Моторошно та надто добре». Нейромережа Midjourney після оновлення V5 генерує ще реалістичніші зображення, і нарешті — з 5 пальцями на руках

Опубликовал
Катерина Даньшина

У середу Midjourney анонсувала запуск нової версії свого ШІ-сервісу для синтезу зображень, який може створювати  реалістичні результати з високою якістю — користувачі вже обізвали їх «моторошними та надто ідеальними».

Midjourney V5 доступна як альфа-версія для передплатників сервісу через Discord.

«Відчуття, що Midjourney нарешті вдягнув окуляри, після того, як довго ігнорував свій поганий зір. Я бачу все у форматі 4K — це неймовірно», — каже графічний дизайнер Джулі Віланд.

Бізнес англійська від Englishdom.
Тут навчають за методикою Кембриджу, завдяки якій англійську вивчили понад 1 мільярд людей. Саме вона використовується в найкращих навчальних закладах світу, і саме за нею створені курси.
Інформація про курс

Віланд поділилася деякими зображеннями, які згенерувала за допомогою Midjourney V5 — і вони, безумовно, демонструють великий прогрес у деталізації з моменту появи сервісу у березні 2022 року.

Midjourney V3 дебютувала в серпні, а V4 — у листопаді. Кожна ітерація додавала щоразу більше деталей до згенерованих результатів, що видно на цих прикладах:

Порівняння зображень, згенерованих Midjourney V3 (ліворуч), V4 (у центрі) і V5 (праворуч) із текстовою підказкою «мускулистий варвар зі зброєю біля кінескопного телевізора, кінематограф, 8K, студійне освітлення». Джерело: Arstechnica

Midjourney працює подібно до Stable Diffusion і DALL-E, та генерує зображення на основі текстових підказок, використовуючи ШІ-модель, що навчалась на мільйонах творів мистецтва, створених людиною. Нещодавно Midjourney потрапила у скандал за недотримання авторських прав щодо коміксів, які використовували попередні версії сервісу.

Поекспериментувавши з Midjourney V5 протягом дня, Віланд зазначила покращення, які включають «неймовірно реалістичні» текстури шкіри та риси обличчя; кінематографічне освітлення; кращі відблиски та тіні; більш виразні ракурси або огляд сцени, а також «майже ідеальні очі». Ну і звичайно руки.

Протягом останнього року виникало чимало обговорень щодо того, як нейромережі відображають пальці на руках — замість попередніх 7-10, Midjourney V5 поки весь час надавала правильні результати з 5-ма. 

Midjourney зазначає, що V5 тепер відповідає «набагато ширшим стилістичним діапазонам», ніж попередня версія, а також більш чутлива до підказок та пропонує 2-кратне збільшення роздільної здатності зображення.

Джерело: Arstechnica

Disqus Comments Loading...