前回、DiffusionBeeとDraw Thingsを使って、「リアル・実写系」に挑戦してみたのだけれど、プロンプトの書き方の違いが結構重要になっているようなので、前回の失敗を踏まえ、Stable Diffusionのプロンプトについて調べてみると、どうやら「文章」というよりも「単語」としての認識がないようで、さらにカンマ区切りするのは「AND」と同じなのだとか。
そして、どうやら「単語」自体を並列的にしかみていないうえ、文章を左から右へと文章として読むわけでもないそうです。
とはいえ、前に書かれた要素ほどわずかに影響が強く出やすいようで、今度は実験的に「プロンプト」を並び替えて生成するのも面白いかも。
なので今後は「プロンプト」を人間的にも理解しやすいように整形して記述していきたいと思います。
まず、「行分け・改行・#」などはAIには無意味なのだそうで、人間的に使用し「背景」や「人物」などをある程度、塊に分け、以下のような感じにしていきます。
[背景], [人物], [服装・体型], [表情・ポーズ], [画風・品質]
なので、本来、今回は「リアル・実写系」の4つのパターンを作成する予定でしたけど、前回のプロンプトである、
Photograph, ocean, japanese girl, tanktop
に笑顔(smile)を加え、新記述法にて再度試してみます。
新しい記述法による生成比較
# 背景
ocean,
# 人物
1girl, japanese,
# 服装
tanktop,
# 表情
smile,
# 画風
Photograph
Diffusion Beeの場合

Seed : 947225 | Steps : 25 | Guidance Scale : 7.5 | Img Width : 768 | Img Height : 768 | Sampler : karras | Model : Stable Diffusion XL Base 1.0 | Mode : txt2img | Selected Style : none
# 背景 ocean, # 人物 1girl, japanese, # 服装 tanktop, # 表情 smile, # 画風 Photograph
笑顔を追加したせいか女性の顔がより日本人らしくなり、10年前のデジカメくらいの仕上がりになっているんじゃないでしょうか。
目元が気になると言えば気になりますが、昔のデジカメクラスなら、これくらいの写真クオリティですし、一般人が撮った普通の写真といってもいいレベルでしょう。
とはいえ、タンクトップに映るうっすらとした桜のような、梅のような花感はいただけませんが・・・。
ネガティブプロンプトを入れていない中でのこの品質なら、十分です。
Draw Thingsの場合

a woman with a lot of water on her head
むむ、Draw Thingsは「#コメント」がお好きでない?
実写ではなくイラストにしてきたばかりか、驚くような芸術感を出してきました。
やはり人間用の「#コメント」はよろしくないのか、よくよく調べてみると、Diffuisin BeeもDraw Thingsも正式にコメント対応しているというわけでもなく、完全に無視するというわけでもないようで、多少なりの影響が出てくるのだとか・・・。
「新記述法」を表明した直後にこれかい・・・。
まっ、とりあえず修正として、日本語コメントを英語に変えて再度挑戦(画風は消去)。

a young woman with a hat on smiling
おおお!海はどこ行ったんじゃ!勝手に帽子被せているし!!
やはりAIが画像を作るうえで、人間のための「コメント」は邪魔でしかないんですね・・・。
Diffusion Beeなら問題ないけど、Draw Thingsには通用しないのであれば、やはり人間用のコメントは「なし」のほうが良さそう。
なので、今後は、改行による塊に分けに留めて挑戦していきます。
しかし、色々と試していくと楽しいなぁ。

