ヤマネコ目線

大体独り言、たまに写真その他、レビュー等

AI遊びがやめられぬ

 書き散らし。前々から何回か記事を書いているStableDiffusionだが、かなり遊び甲斐があって本当に面白い。相変わらず最大解像度は512piexl四方と小さいが、どんな景色を見たいかをテキストで書くだけで見たことも無い景色が無限に生成できる。あんなものも見たい、こんな景色も見たい、そういった願望を無限大に叶えてくれるこのAIは人間の欲深さの象徴かも知れない。

AIによる創作の限界

 AIによる生成の限界についてこれまで少し触れているが、新しくぶち当たった限界があったのでついでに書いておく。上の画像は「宝石で出来た砂浜」を指定して生成させた画像(の中でもまだマシな部類)なのだが、大抵は普通の砂浜っぽい画像が生成されてしまう。おそらく「宝石で出来た」を比喩的に解釈して「宝石のような」と認識しているのではないだろうか。

 私が欲しかったのは砂がまるまる宝石で出来た感じの砂浜だったのだが。これもpromptと言うか、指定するための英文の表現が悪かっただけかも知れない。ネイティブではないのでその辺りの表現を英語でどうするか四苦八苦しながら遊んでいる。画像そのものは自動で生成してくれるものの、どういう景色が見たいのか具体的に指定する必要がある以上、ある程度の英語力と使用者の想像力が試される。

 また、修飾語をどこにかけるかも変わる場合がある。たとえば「青い砂漠」と書けば少なくとも「青い色(に見える)砂の砂漠」を想像すると思うが、この「青い」が空に適用されてしまったりはよくある。AIの中でも砂漠は赤茶色なのだ。この点、学習元のデータにおける概念はなかなか超えられない。「青色に染められた砂漠にある遺跡」と入力してやっと下のような画像が生成される。AIによって心象風景を具現化させることが可能かと思ったが、なかなか難しいものだ・・・思ったんと違う

 

manuller416.hatenablog.com

生成画像サンプル

 ここから少し、生成させた画像のサンプル。多少は厳選あり。全てが全て良い感じではない。呪文をいい感じに練ることが出来れば歩留まりは上がる。まず先にこういう画像を生成させてから、何か物語を想像していくのも面白いかも知れない。なお、どんな呪文をつかって生成したかはあえてここには書かない。魔術の神秘性は秘匿により生まれる。ただ参考になるサイトのリンクはすぐ下に貼っておく。

lexica.art

 崖にある遺跡。上の方にある柱の妙に横に多い筋掘り、中央右寄りの石造りの建物からぴょこっと生えるアホ毛石、左下の通路入口に感じる角度の違和感を除けばおおよそいい感じに出来ている。

 スチームパンクな町の中を走るスチームパンクな車。町自体にあまり「スチームパンク」の修飾がかかっていない気がする。呪文にカメラ、レンズの名前を仕込んだのでカメラで撮った風になっている。車から地面に続いているレール?のようなものは路面電車か何かから拾った要素だろうか。あと電線っぽいのが映るのは何なのだろう・・・。

 サイバーパンクな町を走る古いタイプの戦闘車両。まあまあいい感じ。ただ「サイバーパンクな町」は色味だけでかなり寂れた町になっているように思う。「戦闘車両が走っている町」なので中東あたりの街並みが要素として入っているのだろう。また、タイヤがタイヤなのかクローラー(キャタピラ)と混ざった感じになっている。どっちで走るんだお前は。

 狂気山脈の窪地にある異形の廃墟と化した町。クトゥルフチックな画が見たくて生成させて見たがこういうのもなかなか。非常に面白い。入り口や窓の形は人間が作るものからそう逸脱してはいないものの(おそらく別で指定が必要)、街並み自体は群生するキノコを彷彿とさせる。あるいは夥しい数の墓標か。狂気山脈(Mountains of madness)はクトゥルフ神話の創作者、H.P.ラヴクラフトの小説に登場する架空の山脈。要は未知のバケモノが済む遺跡のあるクソデカ高山地帯。

 魔法図書館とクトゥルフ要素を組み合わせた画像(具体的にどういう指定をしたか忘れた)。「ハリー・ポッター」という語句を入れたのだけは覚えている。面白いことにハリー、ハーマイオニー?らしき後ろ姿と歪んだスネイプらしき人物が描かれている。後ろの異形が描かれた絵画は腕だけが飛び出してるように見えるが・・・スネイプ後ろ後ろ!

 レーザー砲を備えた多角形宇宙船。まあまあいい感じではあるが砲がなんか溶けている。コンセプトアートとしては悪くない。こういう所から着想を得て船体デザインをするのも面白い。ステルスと入れると大抵F-117っぽいものが発生する気がする(これは入れたか忘れたが)。一部の世代ではステルス=F-117らしいので、AIもそうなのかも知れない。確かにインパクトある形ではあるが。

 宇宙船の中の植物園。有機的曲線を描く船体らしき屋根の下で、清流のある植物園が広がっている。太陽光こそ無いが人工的な光でも植物は育つので、決して不可能ではない光景なのだろう。遠い未来の人間はこうした空間で川とは何か、植物とは何かを学ぶのだろうか。

 軍用車っぽい4ドアタイプの角張ったSUV。を生成したかったが思ったよりトヨタ要素が強い。エンブレムなんてほぼトヨタ。さすが世界のトヨタ、AIの世界でも強かった。でも俺が欲しかったのはジムニー寄りの軍用車っぽい4ドアSUVなんだ・・・。

 青い砂漠にある町の遺跡。前述したのと同様に「青い砂漠」ではなく「青く染まった砂漠」という語を用いたが、今度は遺跡の一部が青く染まってしまった。というかまだら模様になってしまっている。まあ、青い砂漠で建物が青い砂岩で出来ていても全く不自然ではないのだが。

 サクラ散る幻想日本庭園。池の中のコイ?の断片は微妙ではあるが、サクラの花びらの散り方や構図、橋を横から撮るこの感じ、こういうのあるなぁ~と思わせられる。橋がもう少し古びた木の質感か、赤かったら良かったのだが。あと擬宝珠?の描き方が甘いのが惜しい。

人間はやはり欲深い

 理想郷の景色を生成させていてふと思ったことがある。もしこういった世界、こういった景色の中に飛び込めたとしても、我々はそこで満足して永遠に暮らすだろうか。そこにいつまで留まるだろうか。最初どんなに美しいと思った景色でも、それが”当たり前”、”日常”になってしまえば人はまた別の景色を目指すのではないか。きっとそうだろうと思う。

 では人間はどうすれば満足するのか。変化があるという事が重要であり、毎日とは行かないまでも、時間をかけてゆっくり変化する世界であれば人間の欲求は満たされる(満たされやすい)のだろうと思う。たとえば上のような世界でも、数日後に来ると全く別の地形になっているなどか。AIはそれを様々な要素をランダムに組み合わせることで人間に提供する。AIは永遠に人々の欲望のままあらゆる景色、写真、イラストを提供し続ける。裏を返せばAIは人間の欲望がついに生み出した怪物であり神であり万能の願望器。

 それにしても、本当にもう少し生成できる画像サイズが大きいならなあ・・・。最低でもFullHD(1,920×1,080)の画像は出せるようにして欲しい。これも欲深さか。