feedback
Google обновил модель Gemini 2.0 Flash, предназначенную для генерации изображений. Это основной конкурент аналогичной модели от ChatGPT. Gemini также мультимодальна и способна понимать контекст изображений.

Во-первых, Google значительно снизил стоимость генерации изображений через API: теперь стоимость $0.039 за картинку, тогда как у OpenAI примерно $0.25. Gemini выходит примерно в 6 раз дешевле.

Добавили описание основных сценариев для использования новой модели:
• Можно загрузить изображение интерьера и отдельно изображение лампы, а затем попросить модель создать изображение интерьера с этой лампой.
• Возможно попросить изменить только цвет дивана на уже существующем изображении. В результате получить то же самое изображение, но с новым цветом мебели.
• Удобно переносить логотипы или другие изображения на готовые макеты, создавать превью мерча.
• Можно загрузить изображение пустого интерьера и экспериментировать с различными вариантами его наполнения мебелью и декором.

Подробнее читайте здесь

Это, кстати, та самая модель, которую я пыталась приручить и привязать к своему vibe code приложению для работы с интерьерами. И в итоге выбрала ChatGPT, т.к. Gemini так и не заработал. Возможно, дело было в лимитах. Сейчас обещают, что их увеличили.

Буду пробовать. Тк в отличие от chatGPT, gemini умеет вносить правки вообще не меняя детали изначального изображения.

@wealldesigners
Google снижает стоимость генерации изображений в Gemini 2.0 Flash
Link copied