У середу Midjourney анонсувала запуск нової версії свого ШІ-сервісу для синтезу зображень, який може створювати реалістичні результати з високою якістю — користувачі вже обізвали їх «моторошними та надто ідеальними».
Midjourney V5 доступна як альфа-версія для передплатників сервісу через Discord.
«Відчуття, що Midjourney нарешті вдягнув окуляри, після того, як довго ігнорував свій поганий зір. Я бачу все у форматі 4K — це неймовірно», — каже графічний дизайнер Джулі Віланд.
Віланд поділилася деякими зображеннями, які згенерувала за допомогою Midjourney V5 — і вони, безумовно, демонструють великий прогрес у деталізації з моменту появи сервісу у березні 2022 року.
Midjourney V3 дебютувала в серпні, а V4 — у листопаді. Кожна ітерація додавала щоразу більше деталей до згенерованих результатів, що видно на цих прикладах:
Midjourney працює подібно до Stable Diffusion і DALL-E, та генерує зображення на основі текстових підказок, використовуючи ШІ-модель, що навчалась на мільйонах творів мистецтва, створених людиною. Нещодавно Midjourney потрапила у скандал за недотримання авторських прав щодо коміксів, які використовували попередні версії сервісу.
Поекспериментувавши з Midjourney V5 протягом дня, Віланд зазначила покращення, які включають «неймовірно реалістичні» текстури шкіри та риси обличчя; кінематографічне освітлення; кращі відблиски та тіні; більш виразні ракурси або огляд сцени, а також «майже ідеальні очі». Ну і звичайно руки.
Протягом останнього року виникало чимало обговорень щодо того, як нейромережі відображають пальці на руках — замість попередніх 7-10, Midjourney V5 поки весь час надавала правильні результати з 5-ма.
Midjourney зазначає, що V5 тепер відповідає «набагато ширшим стилістичним діапазонам», ніж попередня версія, а також більш чутлива до підказок та пропонує 2-кратне збільшення роздільної здатності зображення.
Джерело: Arstechnica