Translation missing: ja.accessibility.skip_to_text

【2D to 3D】Shap-E, Alpha3D, CSMでAI生成画像から3Dモデルを作成

Image to 3Dの各サービスを試して比較

気になっていたサービスから、最近知った新しいサービスなどを一気に試してみました ☺

せっかくなので同じ画像を使用して、各サービスの生成結果を比較してみましょう。

こちらが今回input画像として使用した画像で、Midjourneyで生成しています。

プロンプトはこちら:sneaker from side view --v 5

 

 

検証用の画像を用意する際、Midjourneyはとても便利です!

まずは各サービスの紹介と生成までの流れを紹介します。

 

Shap-E

Shap-E

Chat-GPTでご存知の方も多いOpenAiが開発されたサービスです。

Tex to 3DとImage to 3Dの2種類があり、今回はImage to 3Dで生成しました。

 

生成までの時間は15秒~長くても40秒くらいで生成されるので、結構あっという間です。

生成時にいくつかオプションを変更できます。

いろいろ触ってみると、特にシード値(”Seed”)によってかなり生成にばらつきがでることがわかりました。

最初思ったものが生成されない場合でも、Randomize seedのチェックをONにしたまま生成を繰り返すと近いものがでてくると思います。

 

 

今回の検証時も、実際30回くらいは生成しています

今回検証用に作成したモデルの設定値はこちらになります。

Seed 368591701
Guidance scale 3
Number of inference steps 64

 

Alpha3D

Alpha3D

今回image to 3Dを調べていた時にたまたま見つけたサービスです。

こちらではAI LabとDesigner Studioの2つのサービスがあるようで、今回はAI Labを使用しています。

ここのサービスの面白いところは、スニーカーに特化しているところです。

使い方は画像をアップロードするだけですが、シューズの向きは真横から撮ったものに限定されるようなので、ここだけ注意が必要です。

My Projectのページがあり、そこから生成したものが一覧で見れるのでとても使いやすいです。

 

生成までの時間はだいたい2~3時間ほどでした。

 

 

 

CSM

CSM

いまちょっと話題になっているCSM(Common Sense Machines)。

こちらのサービスの特徴はDiscordを利用して生成するところです。

※詳しい生成方法については公式が提供している動画があるので、こちらをご覧下さい。

 

Discordで生成を行うと、まず三面図のような画像が生成されます。

その下にあるGet 3Dをクリックすると生成がスタートします。

 

生成されたものは、Showcaseのリンク先から確認できます。

しばらくすると自分が生成されたものが出てきます。

 

 

今回は1.5時間くらい生成までにかかりました。

また、1回目の生成がちょっと微妙かも?と思ったので試しに2回生成してみました。

1回目より2回目の方が、比較材料としては良さそうだったので、以下ではこちらのモデルを使用しようと思います!

 

 

比較

それでは生成したものを比較してみましょう。

 

並べてみると全然違って面白いです。

 

Shap-E

アウトラインは何となく靴っぽいです。

また、Shap-Eだけ足を入れるところが空いていて靴っぽさを感じました。

ただディティールの表現は難しいようです。

 

 

こちらはテクスチャーなどはついておらず、頂点カラーが初めから設定されていました。

 

Alpha3D

こちらはスニーカーに特化しているサービスだったので、期待大でしたが...

ソールの部分がアッパー部分と素材感が分かれている点は靴らしさを感じました。

ただ、紐などはテクスチャーで表現されているだけなのでディティールの立体感はないです。なのでテクスチャーが無いと、ほぼ木型に近い状態です。

また真後ろから見るとテクスチャーの再現も完全にされていないのがわかります。

 

 

 

ちなみに、こちらがテクスチャー画像です。

 

 

CSM

ディティールの表現は一番でている気がしました。

テクスチャーなしでもやや認識できる程度に再現されているように見えます。

input画像のビューだけでなく、全体的な角度からみたときのバランスが良いなと思いました。

 

 

こちらがテクスチャー画像です。

 

 

比較まとめと気づいた事

各サービスごとのモデルの形式、ポリゴン数、テクスチャーの有無については以下の通りです。

※Shap-Eは今回両足で生成されましたが、他との比較をわかりやすくするために片方削除しています。

Shap-E Alpha3D CSM
形式 glb glb glb
ポリゴン数 69,512 11,708 30,334
テクスチャー なし あり あり
生成時間 15~40秒 2~3時間 1.5時間

 

今回Shap-Eでは30回程度、CSMで2回生成したように生成する度に結果が異なるので、何度か生成を繰り返してみるもの大事かなと思いました。

 

最後に

同じinput画像から、各サービスでどんな生成結果がでるのか試してみました。

まだまだディティールまでは難しそうですが、1枚の画像から短時間でここまで生成できるのは凄い技術だなーと驚きました。

また、今回使用したサービスは無料で体験できるので、ちょっと試してみよう!と思ったらすぐにできるのもありがたいです

 引き続き面白そうなimage to 3Dのサービスがあれば試してみたいと思います!

(※サービスによっては無料で試せる上限があったり、変更が発生する場合もあるので利用前にご確認下さい)

古い投稿
直近の投稿

お客様のカート