画像生成AIって?
- AIが画像を学習し、人工知能技術を用いてコンピュータが自動的に画像を生成する能力に長けたAI
- 現在の世に普及した画像生成AIの多くは入力したテキストから画像を生成できる
- 2022年は数々の画像生成AIが発表された
Midjourney(ミッドジャーニー)って何?
- 写実的な描写を得意とする
- テキストで生成される画像の内容や要素を指定できる
- 英語のテキスト対応(日本語は現在未対応)
実際に生成してみよう
入力プロンプトは『cherry blossom and woman』
![](https://vstone.co.jp/robotshop/blog/wp-content/uploads/2023/06/wxo_woman_cherry_blossom_e171e710-f1e8-4bd0-85c4-3cf2c90242fb-1.png)
簡単なプロンプトでも問題なく4パターン画像が生成できました。
今回入力したプロンプトでは服装の指定はしていませんでしたが、「cherry blossom」の要素から着物を着た女性が自動で生成されました。
指定の無い部分に関してはAIが他のプロンプトを元に自動的に補完して描画するようです。
よく見ると髪の毛と桜の枝が繋がっている、花弁の形が桜ではない、着物と皮膚が融合している等不自然な点はありますが、画としては綺麗な画像が生成できているのではないのでしょうか。
では動きのある画像はどうでしょうか
入力プロンプトは『many people are running in the woods』
![](https://vstone.co.jp/robotshop/blog/wp-content/uploads/2023/06/wxo_people_runnning_in_the_forest_ab609ad3-620e-48d0-baf4-7dc21353b205-1.png)
こちらも問題なく躍動感のある画像が生成されました。
ただ、先ほどと同じようによく見ると関節の向きが不自然だったり、人の形が崩れたりしていますね。
Midjourneyの生成モデルの特徴
![](https://vstone.co.jp/robotshop/blog/wp-content/uploads/2023/06/wxo_building_3D_model_ec7af3b0-07ab-48b5-90f3-29da909fea72.png)
![](https://vstone.co.jp/robotshop/blog/wp-content/uploads/2023/06/wxo_tentacles_tentacles_not_dark_8bbe807c-cd77-4b60-b75d-3bd12ef618c9-1024x585.png)
このように特に画風を指定せずに生成した場合は画面全体が暗いものが生成されます。
暗さを軽減するには細かなプロンプトでの指示や画像編集で明るくする必要がありそうですね。
生成画像は実用レベル?
画像生成AIの生成画像はそのまま使えるレベルとは言えませんが、一度に複数の画像を生成してくれる点や生成結果のバリエーション等、沢山のアイデアを短期間で生み出す補助の役割に向いているのではないでしょうか。
次の記事では画風の指示をした場合の特徴を見てみましょう。