ヤマネコ目線

大体独り言、たまに写真その他、レビュー等

今さらながらNovelAIを使ってみた

Prompt(呪文)の記述はありません

 絵を描く人間としてはAIは敵にも思えるが、見方を変えれば自分である程度どういった絵が描きたいのかを考えられれば、それを読み込ませてAIに描写させる→そこから良い部分は自分の絵に反映する、という方法も取れる。というか本当はそうした使い方が一番メジャーであるべきだと思う。AIが絵を描くなら、それをさらに踏み台にすれば良い。

という訳で

 NovelAIの研究を遅いながらも始めてみた。StableDiffusionも面白いが、あれは人物に特化していないだけあってどうあっても顔が溶ける、身体の構造が崩れる。

 とりあえずTxt2Img(文章指定で画像生成)で軍服少女を生成させてみた。ちゃんとそれらしいのが出て来ている。悔しいけどやっぱり自分が描くより上手い。全身像は「fullbody」指定で出るが、それで手軽に全身像が出て来るのが末恐ろしい。

 ただしStableDiffusionの記事でも触れたが、AIはそれっぽいものは作れても物事の本質・意味を理解した上で生成している訳ではない。なので服のデザインなんかもよく見れば不合理な点がある。でも俺より上手いんだよな

 同じ呪文で生成した別の画像。左手が何か怪しいがこの程度は仕方ない。こうした細かい所をブラッシュアップ出来るかも「絵が描けるかどうか」で、AIに呪文を入れただけで「絵が描ける」と言い張るべきではない。

 手は多くの人が苦手とする部分なので、多くのイラストで誤魔化される、あるいはあまり良くない形で描かれる、となるとAIはそれらを学習するので、AIですらも手は得意と言えなくなる。元が元なので。

 騎士っぽいの。これもまあまあ良い感じではある。が、胸元にも鎧をつけて欲しかったのが付いていない。あと剣の持ち方はそうじゃない。一部で話題だったラーメンを食べるイラストといい、とんでもない持たせ方はありがち。これもAIが「何がどう持つように作られているのか」、「どの食べ物はどの食器で食べれば良いのか」、といった事は理解していないがゆえのこと。

 ちなみに腰から顔にかけてのこうした構図は「cowboy shot」。アメリカ西部劇で多用された構図なのでそう呼ぶらしい。腰につけたホルスターが画面に入るからだとか。

 騎士っぽいの2。胸にも鎧を付けるように指示したら結構いい感じになった。学習元データに占める数が多いのか、どことなくFate/stay nightのセイバーっぽい。やはりAIによる画像生成は学習元データに縛られやすいのだろう。

 騎士っぽいの3。上の画像と生成呪文は全く同じなのだが、一応セイバーっぽさは抜けた。が、剣はどこに行った?持たせるように指定した筈だが。ああ、風王結界(インビジブルエア)かなるほどな。

 しかし粗捜しもいいが、前の画像やこれといい鎧の質感、服のシワ、陰影表現はなかなか見事である。絵はある種、それっぽく見せたもの勝ちな所も無くはないので、そういう事が出来るのは強み。自分で描き直すにせよ、あるいは塗りの参考にするにせよ大いに参考になる。

雑感

 今回はTxt2Img(Text to Image)だけだったが、Img2Imgも既に少し試しているのでまた記事にする(予定)。どちらにせよStableDiffusionと同じでかなり使い手によって左右される感じはする。

 まず自分がどういったシーンを描きたいのか、そこには何があるのか、人物はどういうポーズ、服装、髪型・色・長さ、目の色、表情なのか、カメラアングルは、画風は、といった事を具体的にイメージ出来なければならない。別にサル真似ならPrompt(呪文)まるまるコピペしたりで出来るだろうが。

 版権モノはキャラクター名だけではあまり出てこない。あまりにも有名なキャラクター(エヴァのアスカとか)なら名前だけでそれっぽいのが出るらしいが、基本的にキャラクター名+そのキャラクターの特徴タグ羅列が必要になる。AIはキャラクターというものを”理解”している訳では無い。

 後は中途半端な呪文詠唱だと中途半端なものしか出てこないので、その辺の研究はやはり必須。特化はしているが完璧ではないし、人体の構造が崩れることもたまにある。作品として世に出すなら最低限の修正は出来る力を持っておくべき。生成してそのままPixivに投稿は迷惑。

余談:サービス自体について

 NovelAIは有料(サブスク)なので、StableDiffusionのデモ版などのように無料で使い倒すことは出来ない。サイトに登録・ログインして有料プラン(月10ドル~)に加入する必要がある。有料というだけで敬遠しがちだが、その辺をどこまで許せるか。プランは3つだが最安値のプランでも十分遊べる。

 サブスクに加入するとanlas(ポイント)がもらえ、そのポイントを消費して画像生成を行う。生成する画像の大きさや生成手法によって必要ポイントが変わる感じ。最安値のプランでは毎月1,000anlasが無条件で付与される。デフォルトのアスペクト比(512×768)ではTxt2Imgで1枚5ポイント、Img2Imgで1枚6ポイントが消費される。単純計算でTxt2Imgのみならば月200枚生成できる。

 とは言え構図を指定して思いのままのイラストを生成するにはある程度の慣れとImg2Imgが必要になるだろうから、それは皮算用ではある。ブラッシュアップして自分の作品として仕上げることを考えれば、ポイントは余りがちになる筈だが。背景は背景で別にStableDiffusionで生成して合成する感じで使っても面白いかも知れない。絵柄によっては背景に対してキャラ浮くが。

 雑に合成してみた図。