ImageFXのモデルが変わったよ
ImageFXで使われるモデルがImagen3からImagen4に変わりました。
Imagen3の生成がわりと好きだったので、Google AI Studioのほうで生成することが増えるのかな。
Imagen4でうまく生成できるように練習しておきましょう。
自然な文章のほうが得意
Imagen4は、言語理解能力が飛躍的に向上しているため、Yamlのような構造化された形式よりも、より自然で詳細な文章(自然言語)でのプロンプトが効果的とのこと。
Yamlで要素を分解して与えると、それらのキーワード自体を画像に含めようとしたり、深い階層のキーワードをスルーしたりといった弊害があるようです。
私自身、カフェを舞台とした画像生成をYaml形式で指示したところ、カフェの設定がすっ飛んでストリートスナップになりました。
好み
生成される日本人女性は、Imagen3のほうが好みでした。
Imagen4だとあまり可愛くならないのよね。
プロンプト次第なところもあるでしょうけど、どうも根っこの部分での違いを感じています。
ImageFX Imagen4
プロンプト
薄暗いカフェの窓際の席に座る、あどけなさの残る18歳の日本人女性。
テーブルには水滴のついたアイスコーヒーが置かれ、店内はドライフラワーで彩られています。
被写体は丸顔で柔らかな頬、短めの顎、垂れ目で大きな優しい茶色の目をしています。
髪型は金髪のボブ。
透き通るような色白の肌、毛穴の見えるリアルな肌質です。
白いキャミソールを着て、シルバーのネックレスと小さな腕時計を着用しています。
わずかに首を傾け、優しい微笑みを浮かべています。
リラックスした自然な姿勢で、柔らかで親しげな視線をカメラに向けています。