ChatGPTのDALL-EやXのGrokでも画像生成はできますがやはり細かい制御ができずもやもやすることも多いのではないでしょうか?
この【ゼロから始める生成AIチャレンジ】のアイキャッチ画像に登場するこの女の子

ChatGPTで作成して一番最初に出てきたんですが同じように作ってもらおうと頑張っても全く出てきません。

近いんですがちょっと違うんですよね。
今回は私がChatGPT(DALL-E)での画像生成から、Stable Diffusionを使った画像生成の沼に足を踏み入れるところまでの記事を書いていきます。
生成AI歴:3か月
お仕事:IT関連企業のインストラクター
保有資格:情報処理安全確保支援士、FP2級、AWS CPEなど
一言:ChatGPTなどの生成AIが登場してすでに2年経っています。
「これから始めるには遅いかな」と思っている皆さん、一緒にがんばりましょう!
(画像はイメージ画像です。ご了承ください。)

シリーズトップはこちら

前回の記事はこちら

ChatGPT(DALL-E)での画像生成
今更かもしれませんがChatGPTに課金すると画像生成AIのDALL-Eが使えるようになります。
ChatGPTに「○○の画像を生成して」とお願いすれば指示に沿った画像をすぐに生成してくれます。
詳しく知りたい方はWiki参照
生成してみる
ちなみに最初にお願いしたのは、吹き出しでいつも使っているこの方

私ですね
この当サイトのメインキャラクター「Akari」をAIで書いてもらおうじゃないか、というところでした。
実際にお願いしたところ

出てきた画像がこちら

なかなかいい画像が出てきましたが、髪形が違うし、できれば全身を使いたかったので、そうお願いしてみます。
次のやりとりはこちら

これもいいですが、髪は後ろ結びにしてくれませんでした。
シチュエーションを変えてお願いしてみる
AKARIキャラの生成をあきらめて、シチュエーションを変えてお願いしてみます。
プレゼンテーション中の画像でキャラクターの服装も変えてお願いしてみます。
スタイルにもちょっと支持を入れてみました。

どこが引っかかったかわかりませんが利用規定に違反している可能性があるようです。
短いスカートなのか胸の大きさなのか、斜め下からの画角が問題なのか、どれかがおそらくアダルトコンテンツの規定に引っかかってるっぽい。
DALL-Eはアダルトコンテンツの作成はできませんので注意が必要です。
引っかかったであろう要素を省いてお願いしてみた結果

こんな画像が作成されました、なかなかいい感じですね。
この調子で何枚かお願いしてみます。
途中でこんなのも出てきます、何回もお願いしているとだんだんリソースがなくなってくるのか精度が低くなります。

と目的の元画像からの展開はあきらめかけたところほかの方法があるとのことで調べてみました。
元画像を固定する
いろいろ調べてみると「シード値」や「gen_id」というものがあってこれが画像生成のキーになっているようです。
詳しくはこちらの方のnoteを参考にしてください

シード値とgen_idを取得する
というわけで聞いてみます。元画像が上にほうに行ってしまったので画像を引用して確認しましょう。(画像クリックすると引用できます(スマホのアプリだとできなかったかも))

gen_idの取得ができました。
続いてnoteに書いてあった通りに指示をしてシード値を含めたコードを取得

キャラクターを固定した画像を生成してみる
noteにはプロンプトを固定して生成する、とありましたがプロンプトを固定するとどうしてもエラーになってしまい、私の元画像を使うとうまく生成できませんでした。
プロンプトの固定はあきらめて生成します。

大体目的通りに行きましたがキャラが固定されたかどうかは怪しいところです。
あとキャラを黒板の右側に立てるようにお願いしたのですが、何をやっても左に立たせてしまって右側には移動してくれませんでした。
出来る方はもとのnoteをじっくり読んでいただいて生成していただければと思います。
画像生成の沼に足を踏み入れる
そんな中Xを見ているといろいろな方から、Stable Diffusionを使っているというお話が聞けました。
次の記事からはこのStable Diffusionが起動して画像を生成するまでの流れにします。
シリーズトップはこちら

前回の記事はこちら

コメント