Команда Google Brain представила нейросеть-художника, которая распознает текст с использованием больших языковых моделей, после чего выдает фотореалистичный рисунок. При этом Imagen генерирует первую картинку размером 64х64 пикселей, а затем повышает разрешениедо 256х256 и 1024х1024 точек, в процессе добавляя детали. ИИ Imagen уже превзошел DALL-E 2 по качеству картинок.
«Наше ключевое открытие заключается в том, что универсальные большие языковые модели (например, T5), предварительно обученные на текстовых массивах, удивительно эффективны при кодировании текста для синтеза изображений: увеличение размера языковой модели в Imagen значительно повышает как точность выборки, так и выравнивание изображения и текста», — заявили разработчики.
Команда Google также сообщила о всплывших этических проблемах, хотя и не вдалась в подробности о тревожном контенте, генерируемом Imagen. D Google Brain отметили, что нейросеть «кодирует несколько социальных предубеждений и стереотипов, в том числе общую предвзятость в отношении создания изображений людей с более светлыми оттенками кожи и склонность к изображениям, изображающим разные профессии, соответствующие западным гендерным стереотипам».
Все потому, что Imagen «скармливали» наборы данных из интернета без 100% предварительного отбора. А информация такого рода часто отражает «социальные стереотипы, репрессивные точки зрения и уничижительные или иным образом вредные ассоциации с маргинализованными группами идентичности». Многие обучающих данные отфильтровали для нежелательного контента. Но использовали и набор данных LAION-400M, который содержит широкий спектр неприемлемого контента, включая порнографические изображения, расистские оскорбления и вредные социальные стереотипы.
Поэтому исходный код Image не представлен публике.
![](https://itc.ua/wp-content/uploads/2022/05/fireshot-capture-327-imagen.research.google-1.png)
![1](https://itc.ua/wp-content/uploads/2022/05/diagram-770x758.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/a-marble-statue-of-a-koala-dj-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/a-strawberry-mug-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/corn-snake-on-farm-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/a-transparent-sculpture-of-a-duck-made-out-of-glass-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/pomeranian-king-with-tiger-soldiers-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/a-wall-in-a-royal-castle.-there-are-two-paintings-on-the-wall-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/a-dragon-fruit-wearing-karate-belt-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/a-bald-eagle-made-of-chocolate-powder-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/a-dog-looking-curiously-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/an-art-gallery-displaying-monet-paintings-the-art-gallery-is-flooded-robots-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/acangialosi_0-1653262269163-1-770x770.jpg)
![1](https://itc.ua/wp-content/uploads/2022/05/restore-apps-1-770x770.jpg)
Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: