【2D to 3D】Shap-E, Alpha3D, CSMでAI生成画像から3Dモデルを作成
Jul 14, 2023
Image to 3Dの各サービスを試して比較
気になっていたサービスから、最近知った新しいサービスなどを一気に試してみました ☺
せっかくなので同じ画像を使用して、各サービスの生成結果を比較してみましょう。
こちらが今回input画像として使用した画像で、Midjourneyで生成しています。
プロンプトはこちら:sneaker from side view --v 5
検証用の画像を用意する際、Midjourneyはとても便利です!
まずは各サービスの紹介と生成までの流れを紹介します。
Shap-E
Chat-GPTでご存知の方も多いOpenAiが開発されたサービスです。
Tex to 3DとImage to 3Dの2種類があり、今回はImage to 3Dで生成しました。
生成までの時間は15秒~長くても40秒くらいで生成されるので、結構あっという間です。
生成時にいくつかオプションを変更できます。
いろいろ触ってみると、特にシード値(”Seed”)によってかなり生成にばらつきがでることがわかりました。
最初思ったものが生成されない場合でも、Randomize seedのチェックをONにしたまま生成を繰り返すと近いものがでてくると思います。
今回の検証時も、実際30回くらいは生成しています☺
今回検証用に作成したモデルの設定値はこちらになります。
Seed | 368591701 |
Guidance scale | 3 |
Number of inference steps | 64 |
Alpha3D
今回image to 3Dを調べていた時にたまたま見つけたサービスです。
こちらではAI LabとDesigner Studioの2つのサービスがあるようで、今回はAI Labを使用しています。
ここのサービスの面白いところは、スニーカーに特化しているところです。
使い方は画像をアップロードするだけですが、シューズの向きは真横から撮ったものに限定されるようなので、ここだけ注意が必要です。
My Projectのページがあり、そこから生成したものが一覧で見れるのでとても使いやすいです。
生成までの時間はだいたい2~3時間ほどでした。
CSM
いまちょっと話題になっているCSM(Common Sense Machines)。
こちらのサービスの特徴はDiscordを利用して生成するところです。
※詳しい生成方法については公式が提供している動画があるので、こちらをご覧下さい。
Discordで生成を行うと、まず三面図のような画像が生成されます。
その下にあるGet 3Dをクリックすると生成がスタートします。
生成されたものは、Showcaseのリンク先から確認できます。
しばらくすると自分が生成されたものが出てきます。
今回は1.5時間くらい生成までにかかりました。
また、1回目の生成がちょっと微妙かも?と思ったので試しに2回生成してみました。
1回目より2回目の方が、比較材料としては良さそうだったので、以下ではこちらのモデルを使用しようと思います!
比較
それでは生成したものを比較してみましょう。
並べてみると全然違って面白いです。
Shap-E
アウトラインは何となく靴っぽいです。
また、Shap-Eだけ足を入れるところが空いていて靴っぽさを感じました。
ただディティールの表現は難しいようです。
こちらはテクスチャーなどはついておらず、頂点カラーが初めから設定されていました。
Alpha3D
こちらはスニーカーに特化しているサービスだったので、期待大でしたが...
ソールの部分がアッパー部分と素材感が分かれている点は靴らしさを感じました。
ただ、紐などはテクスチャーで表現されているだけなのでディティールの立体感はないです。なのでテクスチャーが無いと、ほぼ木型に近い状態です。
また真後ろから見るとテクスチャーの再現も完全にされていないのがわかります。
ちなみに、こちらがテクスチャー画像です。
CSM
ディティールの表現は一番でている気がしました。
テクスチャーなしでもやや認識できる程度に再現されているように見えます。
input画像のビューだけでなく、全体的な角度からみたときのバランスが良いなと思いました。
こちらがテクスチャー画像です。
比較まとめと気づいた事
各サービスごとのモデルの形式、ポリゴン数、テクスチャーの有無については以下の通りです。
※Shap-Eは今回両足で生成されましたが、他との比較をわかりやすくするために片方削除しています。
Shap-E | Alpha3D | CSM | |
---|---|---|---|
形式 | glb | glb | glb |
ポリゴン数 | 69,512 | 11,708 | 30,334 |
テクスチャー | なし | あり | あり |
生成時間 | 15~40秒 | 2~3時間 | 1.5時間 |
今回Shap-Eでは30回程度、CSMで2回生成したように生成する度に結果が異なるので、何度か生成を繰り返してみるもの大事かなと思いました。
最後に
同じinput画像から、各サービスでどんな生成結果がでるのか試してみました。
まだまだディティールまでは難しそうですが、1枚の画像から短時間でここまで生成できるのは凄い技術だなーと驚きました。
また、今回使用したサービスは無料で体験できるので、ちょっと試してみよう!と思ったらすぐにできるのもありがたいです☺
引き続き面白そうなimage to 3Dのサービスがあれば試してみたいと思います!
(※サービスによっては無料で試せる上限があったり、変更が発生する場合もあるので利用前にご確認下さい)