Adobe Fireflyのモデルには「Image3」と「Image4」がありますが、実際どの位の違いになるのかやってみました。
「アート」の設定で進めたのですが、「Firefly Image3」の方がよりイラスト寄りな感じでした。
「視覚的な適用量」の変化もスムーズに感じられました。
同じプロンプトでどの位違うのか気になる方は、画像も掲載していますので良かったら読んでみてください。
Image3での視覚的な適用量による変化
先ずは「視覚的な適用量」を見ていきたいと思います。
以前の記事「Adobe Firefly 視覚的な適用量を変えるとどう変化する?」では、Image4で画像生成をしていました。
今回も5段階で画像生成しています。

今回の「Firefly Image3」での「視覚的な適用量」の変化は次のようになりました。


Image4と違いImage3の方が、視覚的な適用量により徐々に(順当に)描かれていってるような印象です。
クイックモードについて
「Firefly Image3」には「クイックモード」という設定があります。
これはざっくり言うと「小さな解像度で素早く生成する」ような機能です。
あとから高解像度にも変換できますが、その際にプランによっては1クレジット消費します。

縦横比のサイズ
| 縦横比 | 標準 | クイックモード |
|---|---|---|
| 縦(3:4) | 1792x2304px | 448x576px |
| 正方形(1:1) | 512x512px | 2048x2048px |
| ワイドスクリーン(16:9) | 2688x1536px | 672x384px |
クレジット数に限りがあるプランの場合は、使い過ぎないように注意が必要でしょう。
また、クイックモードをONにした状態で「視覚的な適用量」を1段階目で生成した時は、「コンテンツの種類」を「アート」に設定していても4枚とも写真風になってしまいました。
場合によっては2段階目でも写真風のものが混ざって生成されます。

これはPCの環境によるものなのかは分かりませんが、僕の場合は上記の通り写真寄りになってしまうので、この記事ではクイックモードをOFFにして画像生成しています。
これを回避するには、プロンプトに「イラスト風」のワードを入れる、「効果」を設定する(例:アニメ)等の方法が有効なようです。



視覚的な適用量の比較(子猫編)
設定は以下の通りです。
- 一般設定
- モデル:Firefly Image3
- クイックモード:OFF
- 縦横比:縦(3:4)
- コンテンツの種類:アート
- プロンプト:花に囲まれたかわいい子猫
Image4と同じプロンプトで比較するとこのようになりました。
1段階目

1段階目からこんなに違うんですね。
2段階目

3段階目

4段階目

5段階目

Image4と比較するとImage3の方が、少しずつ描き込む量が増えているように感じますね。
視覚的な適用量の比較(風景編)
設定は以下の通りです。
- 一般設定
- モデル:Firefly Image3
- クイックモード:OFF
- 縦横比:正方形(1:1)
- コンテンツの種類:アート
- プロンプト:上空から見る山と森と川
こちらも同じプロンプトで比べています。
1段階目

2段階目

3段階目

4段階目

5段階目

子猫編と同じくImage3の方が、視覚的な適用量により徐々に描かれていってるような印象です。
Image3とImage4の比較
違うプロンプトで、イラスト風とリアルな写真風を比較してみました。
イラスト風
先ずはイラスト風から。
設定は以下の通りです。
Firefly Image3
- 一般設定
- モデル:Firefly Image3
- クイックモード:OFF
- 縦横比:縦(3:4)
- コンテンツの種類:アート
- 視覚的な適用量:3段階目
Firefly Image4
- 一般設定
- モデル:Firefly Image4
- 縦横比:縦(3:4)
- コンテンツの種類:アート
- 視覚的な適用量:3段階目
プロンプトは共通で「暖かな日差しが差し込む部屋の中、ソファーにゆったりと座りヘッドホンで音楽を聴いている日本人女性、その顔は満足げで微笑んでいる、イラスト風」です。


フォトリアル
Firefly Image3
- 一般設定
- モデル:Firefly Image3
- クイックモード:OFF
- 縦横比:縦(3:4)
- コンテンツの種類:写真
- 視覚的な適用量:4段階目
Firefly Image4
- 一般設定
- モデル:Firefly Image4
- 縦横比:縦(3:4)
- コンテンツの種類:写真
- 視覚的な適用量:4段階目
プロンプトは共通で「暖かな日差しが差し込む部屋の中、ソファーにゆったりと座りヘッドホンで音楽を聴いている日本人女性、その顔は満足げで微笑んでいる、フォトリアル」です。


設定についての補足
画像生成は4枚作成されます。その中から同じ並び位置のものを選択しました。
それぞれ似たような構成になっていると思います。
「コンテンツの種類」を「アート」か「写真」をそれぞれ選択していますが、念のためプロンプトの最後に「イラスト風」か「フォトリアル」でそれぞれ表現するようにしてみました。
あまり変に表現されていないものを選択しましたが、どちらの画像もヘッドホンのコードが怪しいですw。
まとめ
Image3とImage4の画像を比較してみました。
モデルの違いでも結構な差がありますね。
イラスト風もフォトリアルも、Image4の方が自然に見えると思うのですがどうでしょうか?
ただしImage3も捨てがたく、作家によるタッチの違いとの印象にも感じられます。
人によって好みがあると思うので、好き嫌いが分かれそうですね。
生成された画像をよく見ると、不自然な部分が見られることもあるので修正が必要なことも出てきそうですが、いずれ破綻のないもが出来てしまうとそれはそれで怖いですね。。
一見、実写と見間違えてしまうほどの画像が創られてしまいますね。生成AIの進化がすごいと感じます。
個人的には、本来この部分に何か小物が欲しい、という時が生成AIの使い方なのかなぁという気もしてます。
でも期待してしまうンですよね。どこまでリアルなものが生成されるのだろうか、と。
最後までご覧いただき、ありがとうございました。参考になれば幸いです。



コメント