ヤマネコ目線

大体独り言、たまに写真その他、レビュー等

Stable-Diffusionで遊んでみる

 最近流行りのAIによる自動生成、誰もが無料でそういったAIにアクセス出来ることを目指して公開されたのがStable Diffusion(という認識であっているだろうか)。今回はそれで遊んでみたので少しその画像を貼って見る。遊んだサイトはここ↓

huggingface.co

 普通にパソコンに学習データを落として楽しむのが良いのだろうが、専門知識が無いのでこういうサイトで遊ぶに留まっている。改めて調べていろいろやってみなければ・・・。

 ちなみにMidJourneyというのもあるが、あちらは有料。絵画チックなタッチはあちらの方が好みではあったが、有料と知らずにDiscordで遊んでいたら「はい、無料期間終わり」と言われた。月額を調べるとなかなか(AdobeのPhotoプランより高い)。円安が恨まれる。

 まずは小手調べ。どんな画像を生成するかの指示は英語で行うため、英語が出来ないとなかなかとっつきづらいだろう。この辺、日本人の好みに合わせた生成AIが登場してくれればなあと思うが、期待すべくもないだろうな・・・。

指示語「A garden made up of only pure rock crystal 」

 「水晶だけで作られた庭園」というつもりで指示したが・・・思いのほかリアル寄りというか、出来るだけ現実寄りで生成されている。「made of」は原材料の質や成分などがそのまま使用して作られている場合に使う。たとえば木のスプーンなど。幻想的な画を出したい場合は何か指示語が必要なのだろうか。ただこれは・・・ただの「庭に置かれたクソデカ水晶原石」では・・・。

指示語「A Shirou Emiya cooking extremely spicy mapo tofu」

 アニメキャラはどう出るのか気になって試してみた。意図は「激辛麻婆豆腐を作る衛宮士郎(Fateの主人公)」だが、ん~・・・近からず遠からず。特徴は少し押さえているものの、髪の毛の色や顔のパーツが惜しい。流石にキャラ指定で独自のシーンを作るのは難しいか。

詠唱にはコツがある

 どうもAIに指示をする際の語句はかなり癖があると言うか、良く言えば人間ほど偏った想像力が無いので厳密にどのような風景を思い浮かべたいのかを理解しないといけないようだ。さながら魔術における詠唱のように、必要な要素を付け足していく事で出てくる画が変わったりする。面白い。高度に発展した科学は魔法と区別がつかない(だっけ?)とは言うが、そういう点でもはや魔法と似通って来るとは。

 たとえば「Rock」と言う単語1つとっても、岩の場合とロックミュージックの場合がある訳で、それをどちらの方向で解釈させるかの呪文が必要になる訳だ。

 と言うわけで下記の記事を参考にさせて頂いた。

note.com

指示語「beautiful concept art landscape painting of rock crystal garden with pool 」

 最初の方の「水晶の庭」を求める指示語を少しブラッシュアップしてみた。急になかなかいい感じになったではないか。あの冒頭の◯ソみたいな画像は私の詠唱が◯ソだったのでそれ相応のものが出てきた訳だ。「Beautiful concept art of」を頭につけるだけでなかなかなものになる。絵画調なのは「landscape painting(風景画)」を入れたから。

 カメラの名前やレンズ名、設定を入れると更にいい感じになるらしいが、私が試した限りではあまりぱっとしなかった。強いていえば作例では被写界深度トイカメラ風になっているものがあった程度。上の画像は「taken with sony a7iii」を入れてみた場合。興味深いことに空撮チックな城の画像になっている。

指示語「beautiful concept art of an ancient ruined city in blue desert by Unreal Engine

 「青い砂漠にある古代の町の遺跡」を錬成しようとした結果。「青い砂漠」という非現実的な風景を錬成するのは苦手らしい。あるいは私の詠唱がまずいのか。とはいえこれが文字列を練るだけで生成されるのだから恐ろしい。

注意すべきこと

 前述した参考記事にも書いてあるが、DiscordでこういったAIによる生成サービスを使う場合は生成された画像が他の人々の目にも触れる事になる。逆に言えば他の人々がどんな画像を生成して遊んでいるのかが見られてとても面白いのだが、実在する人物(特に女性)の名前を使用してうかつな画像を生成してしまうと、意図せずしてフェイクポルノが世に放たれる場合がある。すぐに削除されればまだ良いが、拡散されて訴訟にでも発展した場合を考えると・・・なのでやめましょう。好きな人・キャラの任意のシーンを手軽に錬成できればというのは分からんでもないが。その他、問題がありそうなワードを並べるのは出来るだけやめた方がいい。詠唱に失敗して酷い目に遭うという展開がよもや現実のものになりつつあるとは・・・。

これからのアート

 AIによる画像生成は良く出来てはいる。ここまで来たのかと関心させられる訳だが、場合によっては細部はまだまだ完璧とは言い難いし、解像度もまだ低い。絵を描く者の端くれとしては、こういったAIを自身の想像力を補完するためのツールとして積極的に活用し、生成されたものを自分なりにブラッシュアップすることで真のアートに繋げて行きたいと思う。

 でも普通に追いつけないレベルで上手いんだけど・・・これとか。これはいろいろ詠唱し甲斐がありそうだ。

 色だけスポイトで拾って描きなおしたりするのも面白そう(画力が追いつくとは言ってない)。また、自分が錬成したいと思った言葉からAIが生み出す目新しいものを更に取り込むことも楽しみの1つになるだろう。