Недавно вышло обновление API для image gen от OpenAI. Добавили новый параметр input fidelity. Если выставить его в значение High, то при изменении изображения или миксе двух сохраняются черты объектов и людей.
Наконец-то удалось протестировать. Мне всё же кажется, что хоть лица и стали более узнаваемыми, черты передаются не всегда на 100%. Зато детали одежды, интерьера и предметов выглядят довольно точно. Конечно, всё ещё не идеально, да и угол камеры может немного смещаться. Возможно, из-за того, что image gen поддерживает только разрешения 1024×1024, 1024×1536 и 1536×1024, а входное изображение может быть другим по размеру.
Теперь можно с большей точностью удалять мебель или отдельные элементы из интерьера и заменять их новыми по референсу. Также стало проще виртуально примерять вещи, прически и т.п. В product placement, к сожалению, текст пока искажается, но форма и пропорции передаются неплохо.
Ещё обновили интерфейс platform.openai.com.Появились отдельные вкладки для тестирования текстовых моделей, аудио, изображений и ассистентов.
На мой вкус, в playground с изображениями теперь работать гораздо удобнее, чем в самом ChatGPT. Плюс high input fidelity пока доступно только по API.
@wealldesigners
Наконец-то удалось протестировать. Мне всё же кажется, что хоть лица и стали более узнаваемыми, черты передаются не всегда на 100%. Зато детали одежды, интерьера и предметов выглядят довольно точно. Конечно, всё ещё не идеально, да и угол камеры может немного смещаться. Возможно, из-за того, что image gen поддерживает только разрешения 1024×1024, 1024×1536 и 1536×1024, а входное изображение может быть другим по размеру.
Теперь можно с большей точностью удалять мебель или отдельные элементы из интерьера и заменять их новыми по референсу. Также стало проще виртуально примерять вещи, прически и т.п. В product placement, к сожалению, текст пока искажается, но форма и пропорции передаются неплохо.
Ещё обновили интерфейс platform.openai.com.Появились отдельные вкладки для тестирования текстовых моделей, аудио, изображений и ассистентов.
На мой вкус, в playground с изображениями теперь работать гораздо удобнее, чем в самом ChatGPT. Плюс high input fidelity пока доступно только по API.
@wealldesigners

