Приклад роботи нового ChatGPT-4o
OpenAI представила долгожданное улучшение генерации изображений. Теперь вместо отдельной модели, например DALL-E, новый усовершенствованный генератор изображений является частью GPT-4o.
На рынке существует множество ИИ-моделей для создания впечатляющих визуальных сцен, но они часто испытывают трудности с отображением текста, логотипов и других элементов, которые нередко встречаются в повседневной жизни.
OpenAI утверждает, что ее новая генерация изображений GPT-4o решает эти недостатки. Она может точно воспроизводить текст и лучше следовать инструкциям благодаря своей базе знаний и контексту чата. Кроме того, новая модель позволяет редактировать загруженные изображения или создавать новые, используя загруженное изображение в качестве визуального вдохновения.
Обновленный генератор изображений в GPT-4o уже начинает разворачиваться для всех пользователей ChatGPT Plus, Pro, Team и Free. Поскольку эта модель станет стандартной для генерации изображений в ChatGPT, пользователям больше не нужно будет выбирать ее вручную перед вводом запроса.
Пользователи могут настраивать изображения, указывая соотношение сторон, точные цвета (HEX-коды) или даже прозрачный фон. В ближайшие недели новый генератор появится и для пользователей ChatGPT Enterprise и Edu.
Новую модель также можно использовать в Sora для создания изображений или через специальный DALL-E GPT. Для разработчиков поддержка генерации изображений через API GPT-4o появится в ближайшие недели.
Несмотря на многочисленные улучшения, у модели все еще есть некоторые ограничения:
OpenAI планирует исправлять эти ограничения в ближайшие недели и месяцы.
Все изображения, созданные с помощью этого генератора, будут содержать C2PA-метаданные, а внутренний инструмент OpenAI сможет проверять их происхождение.
Несмотря на некоторые ограничения, новый генератор изображений GPT-4o значительно улучшает точность и гибкость создания изображений. OpenAI обещает дальнейшие усовершенствования, поэтому пользователей ждет еще более качественный и удобный инструмент для работы с изображениями.
Недавно OpenAI запустила GPT-4.5, но с ограниченным доступом — потому что «закончились GPU».
Источник: neowin