ヤマネコ目線

大体独り言、たまに写真その他、レビュー等

AIを使用した被災地の偽画像が出た件

 先日の台風で静岡県はなかなかの被害を受けた訳だが、残念ながらその被災地のものとされるニセ画像をAIで作成、Twitterに投稿した者がおり炎上していた。本人いわくは「いつものノリ」でそういう画像を作成したと言っていたが、やって良い事と悪い事の区別はつけなければならない。

偽画像の見分け方

 まず結論から書けば下記の特徴を見れば見破りやすい。画像生成がStableDiffusion(以下「SD」と書く)でされていることを前提に書いている。

  • 画像サイズが絶妙に小さくないか(特に512ピクセル四方でないか)
  • 画像の縦横のサイズが64の倍数でないか
  • 妙に画質が悪くはないか
  • 人工物や人物の顔などに歪みがないか

 これまでもちょくちょく投稿している通り、SDでは生成できる画像のサイズに1,024ピクセル四方まで、かつ縦横のピクセル数は64の倍数でなければならないという縛りがある。そして一番手軽かつスマホからでも画像を生成する方法はブラウザからSDのdemo版を使うこと。その場合は生成できる画像のサイズが縦横512ピクセルの正方形に固定されているので、疑うべき画像はまずサイズが512ピクセル四方でないか確認した方が良い。それ以外のサイズでも縦横のピクセル数が64の倍数かつ微妙に小さければ疑うべき。

 どのみち1,024ピクセル四方以上の画像は作りづらい(作れない訳ではない)し、今どきのスマホならディスプレイの画素数は横幅でもたいてい1,080ピクセル以上あるはずなので、絶妙に小さい画像は疑ってかかった方が良い。

 妙に画質が悪くないかは画像サイズとほぼ内容がかぶるが、画像は小さければ小さいほど、画質が悪ければ悪いほど誤魔化しが効く。特にスマホの小さい画面でしか写真を見ない人は失礼ながら審美眼が無いので、場合によっては簡単に騙されてしまう。それを狙ってあえて画質を落とす*1ヤツもいるので、「今どきどんなスマホでもこんなクソ画質無いだろ」と思うような画質なら注意すべき。AIによる偽画像以外にも、たとえば写真の無断転載で画質が妙に荒いのはありがち。ウォーターマーク*2Photoshopなどで消して、その粗をカバーするためにあえて画質を落とすような不届き者がいる。というか居た。

 最後に「人工物や人物の顔に歪みがないか」。AIによる画像生成では建物の直線的な部分が妙に歪んだり、画像の中の人物の顔がリアル寄りアニメ寄り関係なくいびつな形になりやすい。よくよく観察すればどこかしらおかしい点に気付くことは出来る。手動で修正をかけていればそれも難しくなるがそれにも限界はある。AIはまだまだ「建物の何にどういう意味があるのか」や、「人間の顔を描く時はどういう年齢の人間をどういう表情で描くべきか」といったことは理解していない。

補足:画像サイズの制約

 1,024ピクセル四方までが最大だとは書いたが、AIによって滑らかかつ高解像度に画像を拡大するサービスあるいはソフトを使えばその限りではない。AIによって生成した画像を拡大し、それを更にFullHD(1,920×1,080)などでトリミングすれば画像サイズは誤魔化しが効く。1,080は64では割り切れないので64の倍数で判別する方法も使えない。ただし、SDで生成した画像は拡大すればするほど細かい部分の粗が目立って来るのでどのみちきちんと観察すれば見破れる。

最後に

 被災地の偽画像を作成するような倫理観に欠けるアホが一番悪いのは当然として、その画像を拡散してしまう人間も悪いと言える。明らかに画質が悪い、画像サイズが小さいのにそれを純粋に被災地の画像だと思って拡散するヤツはバカだとして、分かってて晒し上げるために引用RTなどをするとしても、昔からよく言うように「荒らしに構うヤツも荒らし」。そうやって構う人間がいるからアホがますます調子に乗る。黙ってスパブロ(報告してブロック)するのが一番良い。

 それにしても、被災地の写真をAIで生成するのは褒められた事ではないがある意味では良い線を行っている。というのも前述した通り人工物であれば直線が歪みがちなのでAIによる画像生成は粗が目立ちやすい。しかし災害にあった後の風景ならば多少、場面が荒れていても粗は目立たない。人間もいる必要がない。なのでそうした風景をイラストの背景素材として作りたい場合はSDは有効だったりする。私は何度か荒廃した遺跡のイラストなどを生成させているがなかなかのもの。それにしても、なぜたとえ悪ふざけでも被災地の画像など台風で静岡県が大変な時に流そうとした・・・。

余談

 被災地絡みで見かけたが何だコイツ・・・Twitter覗いたら本当にいろいろ酷くて絶句した。ネタでやってるにしても無いわ。こんなのが保守、右翼だと思われたらたまったものではない。

*1:JPEGでノイズを乗せたり

*2:写真を撮った人の名前などの透かし