Stability AI випустила «‎найдосконалішу» версію своєї моделі синтезу зображень – з 3,5 млрд параметрів

Опубликовал
Катерина Даньшина

Стартап Stability AI продовжує вдосконалювати свої моделі генеративного ШІ й випускає Stable Diffusion XL 1.0 – доступну у відкритому коді на GitHub, на додаток до API Stability та споживчих програм ClipDrop і DreamStudio.

«‎Найдосконаліша», за словами Stability AI, версія забезпечує яскравіші й точніші кольори, кращий контраст, тіні та освітлення в порівнянні з попередницями.

Techcunch пише, що Stable Diffusion XL 1.0 містить 3,5 мільярда параметрів та може створювати повні зображення з роздільною здатністю 1 мегапіксель «за секунди» в кількох співвідношеннях сторін. («Параметри» — це частини моделі, отримані з навчальних даних, які, по суті, визначають навички технології у генеруванні медіа чи тексту).

Попередня версія Stable Diffusion XL 0.9 теж могла створювати зображення з вищою роздільною здатністю, але вимагала більшої обчислювальної потужності.

Курс English For Tech course від Enlgish4IT.
Лише 7 тижнів по 20-30 хвилин щоденного навчання допоможуть вам подолати комунікативні бар'єри. Отримайте знижку 10% за промокодом ITCENG.
Дійзнайтеся більше

Крім вищезазначеного, Stable Diffusion XL 1.0 зможе краще генерувати текстові надписи – раніше логотипи виходили не надто розбірливими. Модель підтримує функції «‎домальовування», тобто розширення зображень, та «‎підказку до підказки», коли користувачі за допомогою тексту можуть оновити згенероване зображення.

Stable Diffusion XL 1.0 також розуміє складні текстові інструкції, які складаються з кількох частин.

Водночас як і попередні версії Stable Diffusion XL 1.0 може стикнутися з етичними проблемами. Її доступність у відкритому коді можуть використати зловмисники для створення шкідливого контенту – наприклад дипфейків. Компанія каже, що вжила «додаткових заходів», щоб запобігти цьому шляхом фільтрації навчальних даних і блокування проблемних термінів в інструменті.

Інша проблема – модель знову використовувала для навчання роботи митців, які виступали проти такого запозичення. Stability AI стверджує, що захищена від юридичної відповідальності доктриною добросовісного використання, принаймні в США, але бере до уваги «‎запити» художників. 

Паралельно з запуском оновленої моделі Stability AI випускає бета-версію функції тонкого налаштування для свого API, яка дозволить користувачам використовувати лише п’ять зображень, щоб «спеціалізувати» генерацію на конкретних людей, продукти тощо. Компанія також переносить Stable Diffusion XL 1.0 на Bedrock, хмарну платформу Amazon для розміщення генеративних моделей ШІ, розширюючи раніше оголошену співпрацю з AWS.

Disqus Comments Loading...