Недавно OpenAI выпустила обновление API для image gen, добавив параметр input fidelity. Если установить его значение на High, то при изменении или смешивании изображений лучше сохраняются черты объектов и людей.
После тестирования стало заметно, что лица действительно стали более узнаваемыми, хотя черты передаются не всегда идеально. Детали одежды, интерьера и предметов выглядят довольно точно. Конечно, результат всё ещё не идеален, и угол камеры может немного смещаться. Возможно, это связано с тем, что image gen поддерживает только разрешения 1024×1024, 1024×1536 и 1536×1024, а размер входного изображения может отличаться.
Теперь можно более точно удалять мебель или отдельные элементы из интерьера и заменять их новыми по референсу. Также упростилась виртуальная примерка одежды и причесок. В product placement текст пока искажается, но форма и пропорции передаются неплохо.
Кроме того, обновился интерфейс platform.openai.com. Появились отдельные вкладки для тестирования текстовых моделей, аудио, изображений и ассистентов.
По мнению автора, работать с изображениями в playground стало удобнее, чем в ChatGPT. К тому же, high input fidelity пока доступен только через API.
После тестирования стало заметно, что лица действительно стали более узнаваемыми, хотя черты передаются не всегда идеально. Детали одежды, интерьера и предметов выглядят довольно точно. Конечно, результат всё ещё не идеален, и угол камеры может немного смещаться. Возможно, это связано с тем, что image gen поддерживает только разрешения 1024×1024, 1024×1536 и 1536×1024, а размер входного изображения может отличаться.
Теперь можно более точно удалять мебель или отдельные элементы из интерьера и заменять их новыми по референсу. Также упростилась виртуальная примерка одежды и причесок. В product placement текст пока искажается, но форма и пропорции передаются неплохо.
Кроме того, обновился интерфейс platform.openai.com. Появились отдельные вкладки для тестирования текстовых моделей, аудио, изображений и ассистентов.
По мнению автора, работать с изображениями в playground стало удобнее, чем в ChatGPT. К тому же, high input fidelity пока доступен только через API.

