
Generated by Stable Diffusion and chilloutmix_Ni
とうとう実写風味も体験してみました――chilloutmix_Niです。
まずこれ、Censorshipに関してヤバいですね。下着を履かせたはずなのに、しゃがむポーズになったばかりに見えちゃったり。考えてみれば、相当難しい代物が出てきたことに気付かされます。風紀のバランスをかなり乱すだろう、と。
呪文によっては、“ノリ”なしの非合法なポルノ画像が出てきかねないわけで。日本を含む性表現に厳格な法律を持つ国では、問題視されるのも時間の問題かもしれません。
“そっち”の人々の目に付かないことを祈るばかりですが、いずれ、世界規模でAIを敵視する規制が法的に叫ばれてくるに違いないはずなので、黎明の今が最も爛熟期とも言えるかもしれません。
さて、Stable Diffusionの楽しみ方について。実のところ、人それぞれではありましょう。エログラビア生成器にしている人もいそうだし、萌えイラスト改造機にしている人もいるかもしれない……ともかく、希望の――好みの絵面の――出力を叶えようとする面は少なからずあると思います。
そのためには:
A. プロンプト・エンジニアリングに沼る
B. 見本(素材の画)を用意する
の二つの方向性がありそうです。
Aはそのまんま、呪文(プロンプト)の最適化のことで、単語を変えるとどのように改善されるかを確かめていく行為のことを指します。
BはControlNetとその学習モデルを用いることで、見本を参照させて特定のイメージに近づけていく行為です。
どちらもやってみましたが、どちらも面白いんですよね。
プロンプト・エンジニアリングでは、想定内でありながら、思った以上に優れた画が出来上がったりすると、テンション爆上がりです。逆に、上手くいかない場合、どのように指示を変えると良くなるか、で夢中になってしまうんですよね。
ControlNetでも、思い通りにならないところと意外性の良いところの両方が見受けられて、飽きません。素材の画に描き加えたりして、その結果を見るのがとても楽しいのです。
Bの行為では、ControlNetの学習モデルの内、CannyとDepthが使えると思います。Cannyは線を抽出してなぞってくれるので、かなり元の印象そっくりの画が出来上がります。対して、Depthは主に輪郭をなぞるだけに留めて、顔かたちやパーツが学習モデル固有のものに置き換わったりします。
次なる段階はとうとう、Loraをやってみるかなぁ、と思う次第です。
- 関連記事
-
スポンサーサイト