Рубрики Новини

Нейромережа Midjourney V4 генерує релевантніші та реалістичніші зображення

Опубликовал
Катерина Даньшина

ШІ-генератор зображень Midjourney доступній в новій альфа-версії. Нейромережа тепер орієнтується на більшу кількість інформації про істот або місця, краще розпізнає дрібні деталі та обробляє складніші підказки. V4 також має змогу опрацювати сцени з кількома об’єктами та персонажами.

Девід Хольц, генеральний директор Midjourney каже, що V4 має абсолютно нову кодову базу та архітектуру штучного інтелекту. Це перша модель, навчена на суперкластері штучного інтелекту Midjourney, розробленому протягом останніх дев’яти місяців.

Хольц описує V4 як перший крок до “чогось глибокого та незбагненного”. Раніше він пророкував блискуче майбутнє для подібних нейромереж, включаючи генерування за допомогою ШІ відеоігор протягом наступних десяти років.

Онлайн-курс "Фінансовий аналіз" від Laba.
Навчіться читати фінзвітність так, щоб ухвалювати ефективні бізнес-рішення.Досвідом поділиться експерт, що 20 років займається фінансами і їхньою автоматизацією.
Детальніше про курс

Midjourney V4 може створювати набагато реалістичніші зображення, тож принципи використання стануть суворішими. Будь-хто, хто явно спробує обійти список заборонених слів у підказці,  ризикує бути забаненим.

Загалом, V4 також вимагатиме абсолютно нового способу формулювання підказок. Функція реміксу, тобто можливість подальшого редагування згенерованих за допомогою ШІ зображень, також включена до оновленої версії. 

Серед обмежень альфа-версії — нині дозволене лише квадратне співвідношення сторін. Надалі розробники працюватимуть над підвищенням роздільної здатності та якості зображень, додадуть налаштування масштабу та різкості.

Незабаром після випуску V4 Midjourney анонсувала ще кілька оновлень, що стосувалися переважно вебінтерфейсу:

  • зображення можна сортувати за колекціями;
  • колекції та зображення з високим рейтингом показуються у верхній частині профілю;
  • профілі можна налаштувати, змінивши ім’я користувача та зображення;
  • в інтерфейс додано широкоекранний режим, попередній перегляд та фільтри;
  • додана можливість пакетних публікацій/видалень;
  • додатково можна налаштувати розмір пакетного завантаження.

У серпні 2022 року Midjourney мала кілька сотень тисяч клієнтів, що генерували мільйони зображень на день приблизно на 10 000 серверів. Попри такий величезний розмір проєкту, у Midjourney працювало всього близько десяти співробітників.

Джерело: The Decoder

Disqus Comments Loading...