Невже OpenAI це зробила! Довгоочікуване покращення генерації зображень

OpenAI запускає генерацію зображень GPT-4o з покращеним текстом та інструкціями фото 1

OpenAI представила вдосконалений генератор зображень у складі GPT-4o.

Відомо, що нова генерація зображень GPT-4o вирішує такі нюанси, як проблеми з відображенням лого, тексту та інших елементів.

База знань і контекст чату дозволяють покращеній моделі точно відтворювати текст і коректніше дотримуватися інструкцій. Також вона дає можливість редагувати завантажені зображення або створювати нові на основі завантаженого зображення.

Доступність

Новий генератор відкривається всім користувачам ChatGPT Plus, Pro, Free, Team. Так як ця модель буде стандартною для генерації картинки в ChatGPT, користувачам більше не доведеться вибирати її вручну перед тим, як ввести запит.

При налаштуванні зображення можна вказувати співвідношення сторін, НЕХ-коди та навіть прозоре тло. Очікується, що найближчими тижнями оновлений генератор також стане доступним для користувачів ChatGPT Enterprise та Edu.

OpenAI запускає генерацію зображень GPT-4o з покращеним текстом та інструкціями фото 2

Які обмеження має модель?

Час генерації: через підвищену деталізацію час створення зображення може становити до однієї хвилини.
Кадрування: довгі картинки, особливо в нижній частині, можуть дуже щільно обрізатися.
Вигадування деталей: запити з недостатньою інформацією в контексті можуть спричинити те, що модель почне «додумувати» деталі самостійно.
Лімітовані знання: створюючи складні концепції, модель може некоректно відтворювати більш як 10-20 об'єктів одночасно.
Нюанси з не латинською мовою: є ризик спотвореного або некоректного відображення символів.
Редагування окремих деталей зображення не завжди виходить без побічних змін на зображенні.
Модель може чітко не відображати дрібні деталі.

Планується, що OpenAI розпочне виправлення цих обмежень у найближчі тижні-місяці.

Крім того, всі картинки, створені за допомогою цього генератора, включають C2PA-метадані. У той же час, внутрішній OpenAI інструмент зможе аналізувати їх походження.