【神機能が登場】Midjourney / describeの基本的な使い方

May 31, 2023

2023年4月にMidjourneyに、新コマンド”describe”が登場しました。

このコマンドを使って画像をポストすると、画像の内容を分析し、プロンプトを作成してくれます。これまではプロンプトから画像を作る。プロンプト内で画像を参照するしかできませんでした。しかし、”describe”機能を使うことで、Midjourneyがその画像をどのように捉えているか、プロンプト化するかということが非常にわかやすくなりました。

とはいえ、この機能を使えばすぐにイメージ通りプロンプトが完成するかというと、それは疑問です。このブログでは、”describe”機能の基本的な使い方と活用方法を解説します。

５つのステップ

１：画像をアップロードして”describe”を実行する

２： ”describe”機能で、プロンプト化された結果を確認する

３：作成されたプロンプトを実行する

４：”describe”で作ったプロンプトと作成された画像を分析する

５：”describe”結果をうまく組み合わせて理想のプロンプトを作る

ステップ１.画像をアップロードして”describe”を実行する

まず基本的な使い方についてご説明します。

Discord（ディスコード）のメッセージ欄に、/describe と入力します。すると上の画像のような表示になります。「Drag and drop or click to upload file」に画像をドラッグ&ドロップするか、そこをクリックしてみましょう。

画像がアップロードできると、下の図のように表示されます。

ここでエンターキーを押すと、”describe”が実行されます。

ステップ：2. ”describe”機能で、プロンプト化された結果を確認する

”describe”の実行が完了すると、以下のような結果が届きます。結果中には、４種類のプロンプトと、投稿時の画像が含まれています。

４種類のプロンプトは、画像の解析視点を少しずつ変えたもので、画像の情報からフォーカスしている特徴が異なります。

４種類のプロンプトの違いは自体を読めばある程度内容の把握は出来ますが、実際にこれを画像を生成してみるのが一番です。

ステップ：３. 作成されたプロンプトを実行する

プロンプトの実行は非常に簡単です、対応する番号を選択肢、画像下の番号をクリックしてください。そうするとそのプロンプトを使用したが画像生成が実行されます。

以下の画像では、１を選択してその結果が表示されています。

ステップ４：”describe”で作ったプロンプトと作成された画像を分析する

４種類のプロンプトを実行した結果のまとめは以下になります。

いかがでしょう？４種類とも全く異なった特徴を捕らえています。

１つ目は、草原の上に置かれた白いシャツという特徴ですね。”Tシャツ”と書いてないので、襟付きのシャツも含まれ生成ています。プロンプト中に”glen orbik”という単語が入っていて、リンクがかけられています。こちらは、関連する特徴的な固有名詞です。この画像の解析結果から、このアーティストの作風等が近いとAIが考えたのです。このようにプロンプト内に含まれる特徴的な固有名詞にはリンクがかかっており、リンクからGoogleの検索結果を見ることが出来ます。

２枚目は、Tシャツと指定してあるのでそれだけが出ていますね。

３枚目は、胸のロゴプリントを解析し強調したのでしょう。Tシャツがどのような状態にあるかがプロンプト内に指定されていないので、実行時に自動的にAIが補って、人が着ている状態で画像が生成されています。また、”queuing up”は、ロゴの文字列の配置についての指定なのですが、画像生成時には人間が並んでいる状態になってしまっています。このようにプロンプト内で指定する事象やかかる物が曖昧な場合は、全く想像と異なるものが生成されます。

４枚目は、非常に独創性の高い解析結果ですね。実際の画像には”OpenFashion”のロゴが入っているわけですが、このプロンプトでは”quintessential t”という単語が書かれていると抽出されていますね。またここでは洋服であることは言及されず、文字自体が草に綴られているということなので、Tシャツは登場していません。他にも、より抽象的な作品としてテイストやスタイルが書かれています。

“glen orbik”のリンクから、Googleの検索結果に飛ぶことができる

ステップ５：”describe”結果をうまく組み合わせて理想のプロンプトを作る

”describe”による結果はかなりAI独自の解析が含まれます。そのため思いもよらない固有名詞が含まれたり、テイストがでてくることもあるでしょう。しかしそれらのを分析し、特徴を組み合わせせることで、自分の表現したい内容はどのようにプロンプト化するのが良いかを考えることができます。

同じような配置で胸にプリントのあるTシャツを作りたいとした場合.…

例えば、こちらは１や２のTシャツが草原に置かれているという部分と４のロゴに関する部分を参照ミックスして作ったプロンプトを作ってみました

こちらは、”describe”に使った画像をプロンプト内で参照し、その後に２のプロンプト文をいれたものです。かなり元の画像に近い配置や内容で再現できていますね。

おわりに

いかがでしたでしょうか？今回は基本的な使い方を説明するために、シンプルな画像で実行しました。そのためもしかすると、自分でプロンプトを書いたほうが早い、よりイメージ通りのものがかけてしまうかもしれません。しかし、実際に作りたいものはそのようにシンプルなものばかりとは限りません。どのようになっているか細部の説明が難しい、テイストをうまく言語化出来ないなどの場合には、まずこの”describe”の機能を試してみることをオススメします。

今後のブログでは、さらに洋服に絞って”describe”機能ので得意不得意の解説、また”describe”では抽出できない洋服の特徴を指示し、クオリティを上げるためのプロンプト集などを公開していく予定です。

どうぞこれからのブログもお楽しみに！