Новости Технологии 25.05.2022 в 09:18 comment views icon

Google представила нейросеть Imagen, создающую картины и фотореалистичные изображения из текстового описания. И она лучше DALL-E 2 [+фото]

author avatar
https://itc.ua/wp-content/uploads/2024/03/photo_2023-07-03_19-21-48-1-96x96.jpg *** https://itc.ua/wp-content/uploads/2024/03/photo_2023-07-03_19-21-48-1-96x96.jpg *** https://itc.ua/wp-content/uploads/2024/03/photo_2023-07-03_19-21-48-1-96x96.jpg

Тетяна Нечет

Автор новостей

Раздел Технологии выходит при поддержке Favbet Tech

Команда Google Brain представила нейросеть-художника, которая распознает текст с использованием больших языковых моделей, после чего выдает фотореалистичный рисунок. При этом Imagen генерирует первую картинку размером 64х64 пикселей, а затем повышает разрешениедо 256х256 и 1024х1024 точек, в процессе добавляя детали. ИИ Imagen уже превзошел DALL-E 2 по качеству картинок.

«Наше ключевое открытие заключается в том, что универсальные большие языковые модели (например, T5), предварительно обученные на текстовых массивах, удивительно эффективны при кодировании текста для синтеза изображений: увеличение размера языковой модели в Imagen значительно повышает как точность выборки, так и выравнивание изображения и текста», — заявили разработчики.

Команда Google также сообщила о всплывших этических проблемах, хотя и не вдалась в подробности о тревожном контенте, генерируемом Imagen. D Google Brain отметили, что нейросеть «кодирует несколько социальных предубеждений и стереотипов, в том числе общую предвзятость в отношении создания изображений людей с более светлыми оттенками кожи и склонность к изображениям, изображающим разные профессии, соответствующие западным гендерным стереотипам».

Все потому, что Imagen «скармливали» наборы данных из интернета без 100% предварительного отбора. А информация такого рода часто отражает «социальные стереотипы, репрессивные точки зрения и уничижительные или иным образом вредные ассоциации с маргинализованными группами идентичности». Многие обучающих данные отфильтровали для нежелательного контента. Но использовали и набор данных LAION-400M, который содержит широкий спектр неприемлемого контента, включая порнографические изображения, расистские оскорбления и вредные социальные стереотипы.

Поэтому исходный код Image не представлен публике.

Раздел Технологии выходит при поддержке Favbet Tech

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: