ИИ-стартап OpenAI добавил в ChatGPT и Sora генератор изображений на базе модели GPT-4o. Он доступен всем пользователям продуктов компании.
4o image generation has arrived.
It's beginning to roll out today in ChatGPT and Sora to all Plus, Pro, Team, and Free users. pic.twitter.com/pFXDzKhh2t— OpenAI (@OpenAI) March 25, 2025
Ранее для создания картинок в ChatGPT применялась модель DALL-E 3, а за работу с текстом отвечала GPT-4o. Теперь последняя применяется и для генерации изображений в чат-боте.
GPT-4o «думает» немного дольше DALL-E 3 в ходе создания работы. Это необходимо для генерации более точных и детализированных изображений, подчеркнули в OpenAI. Модель способна редактировать существующие картинки, в том числе с людьми, трансформируя или убирая детали — объекты на переднем и заднем плане.
Creating and customizing images is as simple as chatting using GPT‑4o—just describe what you need, including any specifics like aspect ratio, exact colors using hex codes, or a transparent background. pic.twitter.com/fnen1aDjNZ
— OpenAI (@OpenAI) March 25, 2025
«Создавать и настраивать изображения так же просто, как общаться в чате с помощью GPT-4 — просто опишите, что вам нужно, включая любые особенности, такие как соотношение сторон, точные цвета с помощью шестнадцатеричных кодов или прозрачный фон», — подчеркнула OpenAI.
CEO стартапа Сэм Альтман подчеркнул «невероятность» нового продукта.
we are launching a new thing today—images in chatgpt!
two things to say about it:
1. it's an incredible technology/product. i remember seeing some of the first images come out of this model and having a hard time they were really made by AI. we think people will love it, and we…— Sam Altman (@sama) March 25, 2025
«Я помню, как видел некоторые из первых изображений, сделанных этой моделью, и не верил, что они действительно созданы искусственным интеллектом. Мы думаем, что людям это понравится, и с нетерпением ждем результатов творческой деятельности», — написал он.
Он продемонстрировал изображение, сгенерированное во время презентации нового инструмента. Пользователи обратили внимание, что ИИ так и не научился создавать для людей пять пальцев.
bro got violated pic.twitter.com/TMA9luo3id
— adi (@adonis_singh) March 25, 2025
Компания подчеркнула наличие цензуры для борьбы с генерированием изображений, которые могут нарушать политику фирмы. Это касается материалов о сексуальном насилии над детьми, фейков, наготы реальных людей и так далее.
Напомним, в марте руководитель отдела по разработке Sora Рохан Сахай заявил о желании OpenAI интегрировать видеогенератор в ChatGPT.
В декабре 2024 года стартап выпустил инструмент для создания видео в публичный доступ. Нейросеть создает ролики по текстовым промптам, «оживляет» изображения, расширяет существующие работы и заполняет недостающие кадры.