Я решила проверить, насколько хорошо инструменты Runway References и Midjourney Omni-References справляются с переносом персонажа в серию разноплановых сцен одного сюжета, а не в единичные случайные изображения.
Для эксперимента я сгенерировала несколько изображений персонажа, которые могли бы пригодиться, например, для ролика о дороге девушки на работу и её работе. Задача несложная, но позволяет выявить важные нюансы.
Runway мне понравился больше. Он предсказуемее. Никогда бы не подумала, что скажу такое о Runway, но у них UX реально лучше: можно задавать названия для референсов, ссылаться на них и загружать сразу несколько. Плюс Runway лучше следует запросу.
Midjourney часто выдает фронтальный ракурс, даже если в описании указан «вид сзади» или «вид сбоку». Контролировать это получалось только через загрузку примера нужной композиции с пометкой «image prompt». Но и тогда сложно получить сложную позу и ракурс. Можно выбрать только один omni reference.
Еще один плюс Runway в том, что если явно не менять одежду в запросе, персонаж в основном остается в оригинальном наряде. Midjourney же постоянно переодевает героя, если детально не описать его одежду.
Из минусов Runway: больше мелких недочетов, таких как кривые руки, пальцы и лица на заднем плане. Но это можно исправить редактированием.
В Midjourney детали вроде бы более правильные, и их больше. Но что-то случилось с картинкой, и все кадры, на мой вкус, какие-то пластиковые.
В обоих случаях часто 1–2 из 4 сгенерированных изображений оказываются непригодными.
P.S. Все варианты выложу в комментариях.
@wealldesigners
Для эксперимента я сгенерировала несколько изображений персонажа, которые могли бы пригодиться, например, для ролика о дороге девушки на работу и её работе. Задача несложная, но позволяет выявить важные нюансы.
Runway мне понравился больше. Он предсказуемее. Никогда бы не подумала, что скажу такое о Runway, но у них UX реально лучше: можно задавать названия для референсов, ссылаться на них и загружать сразу несколько. Плюс Runway лучше следует запросу.
Midjourney часто выдает фронтальный ракурс, даже если в описании указан «вид сзади» или «вид сбоку». Контролировать это получалось только через загрузку примера нужной композиции с пометкой «image prompt». Но и тогда сложно получить сложную позу и ракурс. Можно выбрать только один omni reference.
Еще один плюс Runway в том, что если явно не менять одежду в запросе, персонаж в основном остается в оригинальном наряде. Midjourney же постоянно переодевает героя, если детально не описать его одежду.
Из минусов Runway: больше мелких недочетов, таких как кривые руки, пальцы и лица на заднем плане. Но это можно исправить редактированием.
В Midjourney детали вроде бы более правильные, и их больше. Но что-то случилось с картинкой, и все кадры, на мой вкус, какие-то пластиковые.
В обоих случаях часто 1–2 из 4 сгенерированных изображений оказываются непригодными.
P.S. Все варианты выложу в комментариях.
@wealldesigners

