Google Nano Banana змінює ШІ-генерацію зображень: поєднання елементів без спотворення та багатокрокове редагування

Опублікував Андрій Русанов

Днями Google представив значне оновлення творчих можливостей ШІ з Gemini 2.5 Flash, також відомого як Nano Banana. Генератор вже посів перше місце в рейтингу LMArena та отримує захопливі відгуки.

Nano Banana розроблений для розв’язання однієї з найбільших проблем штучного інтелекту: узгодженості. Google не просто намагається забезпечити точне редагування та результат через багатоетапне налаштування та безперешкодне змішування. Компанія прагне створити культурний прорив та вивести створення високоякісних зображень в маси.

Gemini 2.5 Flash доступний у застосунку та для розробників через платформи Gemini API, Google AI Studio та Vertex AI. За відгуками, Nano Banana дійсно якісно впорався з узгодженням різних елементів у результаті редагування.

“Я перевірив, як Nano Banana може перетворити одне базове зображення на повноцінну кінематографічну послідовність. Узгодженість між сценами бездоганна, немає потреби перебудовувати все з нуля кадр за кадром. Це змінює все для швидкості та тону розповіді історій. Робочий процес? У 10 разів швидший”, — пише @D_studioproject в X.

Якщо потрібно відредагувати дрібні деталі зображення, зазвичай штучний інтелект змінює всю картинку, що надзвичайно дратує. Google відкрито пишається покращенням цієї можливості: користувачі можуть, наприклад, завантажити фотографію людини та спробувати одягнути її у різне вбрання, змінити зачіску або помістити в інше оточення без жахливого спотворення.

Google Nano Banana / X. @8co28

“Чудові новини для жінок! Просто вставте селфі та фотографію вбрання, яке ви хочете одягнути, у систему штучного інтелекту, і він створить ваше зображення вас у цьому вбранні в природних умовах, у приміщенні чи на вулиці, з неймовірною точністю. Можливість була й раніше, але це змінює правила гри”, — розповідає @8co28 у коментарі до цього неймовірного зображення.

Офіційний акаунт Google Gemini App також наводить кілька прикладів, з наголосом саме на поєднання зображень. Наприклад, як оцей космонавт, котрий грає у баскетбол на закинутому майданчику у джунглях.

Програма також підтримує багатокрокове редагування, яке дозволяє отримувати та переглядати результат поступово. Можна, наприклад, один за одним додавати елементи інтер’єру у кімнату, знову ж, без змін та спотворення решти зображення. Ще одна цікава можливість — змішування стилів. Стиль з одного зображення можна застосувати до об’єкта на іншому.

Рейтинг Nano Banana у LMArena

Створення реалістичних зображень чи відео як ніколи порушує питання підробки. Окрім звичайного водяного знаку, Gemini 2.5 Flash ставить невидимий цифровий водяний знак SynthID, який можна виявити навіть якщо зображення було змінено.

Свого часу можливості ChatGPT зі створення зображень допомогли суттєво збільшити кількість користувачів застосунку, головним чином завдяки величезній навалі зображень у стилі Studio Ghibli. Ймовірно, Google Nano Banana дасть схожий ефект.

Джерело: TechSpot

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.