|
「3D の大規模モデルで、ついに鋭角を生成できるようになりました!」 「しばらく 3D 人工知能を勉強した後、ようやく Hyper3D.ai を通じて Rodin 1.5 を使用できるようになりました。これは本当にゲームチェンジャーになる可能性があります。」 2024 年の最終日に、3D 生成ツールRodin Gen-1.5がリリースされ、オンラインで 3D 生成に関する新たな議論の波が巻き起こりました。 Rodin の開発チームであるYingmou Technology の CTO、Zhang Qixuan氏は次のように述べています。 大規模な 3D モデルでこのような鋭いエッジが生成されるのは初めてのことです。これは「滑らかさの時代に生まれた鋭い異端児」とでも言いましょうか、CAD 工業モデルやハードサーフェス モデルに対して絶対的な優位性があり、3D 生成のユーザー ベースを拡大します。 体験リンク: Hyper3D.ai ロダンのアップデートは多くの海外ユーザーが休暇を取っていた年末と重なったが、新モデルをテストする熱意は衰えなかった。 「二都市の戦い」のヘクステック・ガントレットであろうと、 あるいはもっと精巧なサイバーパンクブーツなら Rodin Gen-1.5 は、これらの適切に構造化されたモデルを簡単に処理します。 アニメーターの中には、Rodin が生成したアセットをアニメーション制作に直接使用している人もいます (以下のビデオの 3D アセットの 70% は Rodin によって生成されました)。 △出典:ビリビリUPの3D動画制作者、肖登子 もちろん、このようによく構成された生成モデルは、3D プリント愛好家にとっても非常にユーザーフレンドリーであり、少し塗装するだけで繊細なおもちゃになります。 AI生成分野のプロのユーザーも、ロダンが生成したモデルの品質を高く評価しています。 しかし、3Dモデル会社であるShadowmoon Technologyがこの分野にいくつかの「小さな衝撃」をもたらしたのはこれが初めてではありません。 3D大規模モデル開発の「非コンセンサス」な道2024年8月、世界最高峰のコンピュータグラフィックスカンファレンスであるACM SIGGRAPHにおいて、Yingmouと上海科技大学が共同開発した3Dネイティブ大規模モデル「Clay」が発表されました。Clayは、同年にチームが開発した3D衣服生成モデル「Dresscode」と共に、SIGGRAPH 2024の最優秀論文賞にノミネートされました。同チームは、この分野で唯一、同じ最高峰の学術カンファレンスで2つのノミネートを獲得した中国チームとなりました。 Clay の導入により 3D 生成の品質が大幅に向上し、現在の学術界では大規模な 3D モデルに対する技術的アプローチとして広く認識されるようになりました。 △ ClayとDressCodeがSIGGRAPH 2024で最優秀論文賞を受賞 CLAYをベースとした3Dアセット生成ツール「Rodin Gen-1」が昨年6月にリリースされました。その生成効果は「Production-Ready(実稼働レベル)」に最も近いことから、発売以来大きな注目を集めています。 そのビルドクオリティと使いやすさは、当時の類似製品をはるかに凌駕していました。優れたビルドパフォーマンスのおかげで、Rodinはわずか45日で100万ドルのARRを達成しました。一方、有名なHeyGenは、同じ数字に到達するのに7ヶ月かかりました。 その背景には、Yingmou の「生産準備完了」への揺るぎない追求があります。 「プロダクションレディ」という用語はCG業界に由来しています。CG業界では「ポストプロダクション」という用語があり、「プロダクションレディ」は後続のワークフローに直接統合できることを意味します。 これは、Yingmouの製品研究開発におけるコンセンサスでもあります。このコンセンサスこそが、Yingmouが大型3Dモデルの開発に着手した際に「非コンセンサス」の道を歩み始めたきっかけです。 当時、 2Dから3Dへのアップスケーリング技術は学術界における主流の3D生成方法であり、同時に、いくつかのチームがすでに2Dアップスケーリング技術パスに基づいた3D生成製品を発売していました。 しかし、長年の技術探求と製品開発の経験に基づき、Yingmouは2Dから3Dへのアップグレードパスにおけるボトルネックを認識していました。2Dデータは結局のところ、実物の片面しか記録しておらず、画像をどれだけ多くの角度から撮影しても、3Dコンテンツを完全に記述することはできません。そのため、モデルは依然として多くの欠落情報を学習し、生成された結果には依然として多くの手動修正が必要となり、ユーザーのニーズを満たすことが困難です。唯一の解決策は、最初からネイティブ3Dデータを使用することです。 当時、Yingmouは急速に悪化する資本環境により資金調達に失敗しており、難しい選択を迫られていました。 問題は、まずは主流の技術を使って製品を作り、それを世に出すのか、それともまだよくわかっていない技術にもっと力を入れて格闘するのか、ということだ。 Yingmou チームは後者を選択しました。これはより困難で、より多くの時間を必要としましたが、正しい選択でした。 7 か月後、彼らの正確な直感とテクノロジーに対する粘り強さが実を結びました。 Rodin Gen-1.5のリリースは、Shadowmooの「Production-Ready(生産対応)」へのコミットメントをさらに示すものです。新世代のネイティブ3D表現により、Rodin Gen-1.5は、業界における長年の課題である薄面とエッジのシャープネスを包括的に解決し、業界全体の3D生成における商用基準を再び引き上げます。 無機的な形状、シャープなエッジ、そして驚くほどクリーンなトポロジーを生成する能力は、Rodin 1.5が3D生成において提供する最も顕著なパフォーマンス向上です。これは特にゲーム、そしてさらに重要な点として製品デザインにおいて重要です。このアップグレードにより、Shadowmooの製品における優位性はさらに拡大します。 ゲームとアニメーションのワークフローに入りました。Rodin のジオメトリと PBR マテリアルの正確な生成機能により、ユーザーはさまざまなシナリオに適した 3D アセットをすばやく作成できるようになりました。 ユーザーはすでに、ゲーム作成を支援するロディンの機能をテストしています。 単一の静的オブジェクトを直接生成できるメソッドがあります。 △出典: X.com @MartinNebelong 大規模なシーンで NPC を一括生成する方法もあります。 実際、一部のユーザーは、Rodin によって生成された結果をすでに独自のゲームに組み込んでいます。 個々の開発者の中には、Rodin をベースにした完全なワークフローを構築した人もいます。 △出典:ビリビリUPマスターT-BOY アニメーションや映画制作もロダンの主な用途です。 あるユーザーは、ロダンによって生成されたアセットを使用して町全体を構築し、簡単なアニメーションを作成しました。 △出典:X.com @jungle_jimjim 一部のユーザーは、これを既存の AI アプローチと組み合わせて、オフライン エンジンで高品質の CG コンテンツを作成しています。 △出典: X.com @Itryandlearn3D いくつかの調整を加えるだけで、ロダンの資産は映画品質の基準に達することも可能です。 △出典:ビリビリUPマスターT-BOY 3D 大規模モデルが「ChatGPT の瞬間」を迎えるのはいつでしょうか?Yingmou 氏は、Rodin-Gen 1.5 より前では、大規模な 3D モデルの開発は主に 2 つの段階を経ていたと考えています。
Rodin Gen-1.5 のリリースにより、大規模 3D モデルがレベル 3 に到達し、生成されたモデルのより正確で詳細な表現が可能になり、大規模 3D モデルに関する長年の問題が解決され、大規模 3D モデルのアプリケーション境界が大幅に拡大されました。 ここ数年、生成AIはテキスト、画像、音声、動画処理において飛躍的な進歩を遂げており、3D生成は「世界モデル」の「最後のピース」と捉えられることが多くなっています。技術の進歩と消費者需要の高まりにより、3D業界は将来が有望視されています。昨年は、Autodesk、Meta、NVIDIA、Tencent、Microsoftなどが独自の大規模3D生成モデルを発表し、この最先端分野への積極的な進出を図りました。業界大手との競争において、Yingmouチームは3Dモデリング/グラフィックスに関する深い専門知識と3D業界のユーザーニーズへの深い理解により、技術面と商業化の両面で長期にわたりリードを維持してきました。 3D生成には、将来的にも探求の余地が大いにあります。AR/VR/仮想世界におけるパーソナルクリエイションを実現するには、ユーザーの3Dコンテンツ作成能力を最大限に引き出す必要があります。世界は3次元空間に構築されるため、将来、機械による世界の理解は必然的に3次元に基づくものとなるでしょう。そのため、身体性知能の分野において、3Dへの需要は常に存在し続けるでしょう。 Yingmou Technology などの 3D 大規模モデル チームの共同の努力により、3D 分野に「ChatGPT」の瞬間が間もなく到来すると信じています。 雲中が奥飛寺から報告、QbitAI | WeChat公式アカウント QbitAI「3D の大規模モデルで、ついに鋭角を生成できるようになりました!」 「しばらく 3D 人工知能を勉強した後、ようやく Hyper3D.ai を通じて Rodin 1.5 を使用できるようになりました。これは本当にゲームチェンジャーになる可能性があります。」 2024 年の最終日に、3D 生成ツールRodin Gen-1.5がリリースされ、オンラインで 3D 生成に関する新たな議論の波が巻き起こりました。 Rodin の開発チームであるYingmou Technology の CTO、Zhang Qixuan氏は次のように述べています。 大規模な 3D モデルでこのような鋭いエッジが生成されるのは初めてのことです。これは「滑らかさの時代に生まれた鋭い異端児」とでも言いましょうか、CAD 工業モデルやハードサーフェス モデルに対して絶対的な優位性があり、3D 生成のユーザー ベースを拡大します。 体験リンク: Hyper3D.ai ロダンのアップデートは多くの海外ユーザーが休暇を取っていた年末と重なったが、新モデルをテストする熱意は衰えなかった。 「二都市の戦い」のヘクステック・ガントレットであろうと、 あるいはもっと精巧なサイバーパンクブーツなら Rodin Gen-1.5 は、これらの適切に構造化されたモデルを簡単に処理します。 アニメーターの中には、Rodin が生成したアセットをアニメーション制作に直接使用している人もいます (以下のビデオの 3D アセットの 70% は Rodin によって生成されました)。 △出典:ビリビリUPの3D動画制作者、肖登子 もちろん、このようによく構成された生成モデルは、3D プリント愛好家にとっても非常にユーザーフレンドリーであり、少し塗装するだけで繊細なおもちゃになります。 AI生成分野のプロのユーザーも、ロダンが生成したモデルの品質を高く評価しています。 しかし、3Dモデル会社であるShadowmoon Technologyがこの分野にいくつかの「小さな衝撃」をもたらしたのはこれが初めてではありません。 3D大規模モデル開発の「非コンセンサス」な道2024年8月、世界最高峰のコンピュータグラフィックスカンファレンスであるACM SIGGRAPHにおいて、Yingmouと上海科技大学が共同開発した3Dネイティブ大規模モデル「Clay」が発表されました。Clayは、同年にチームが開発した3D衣服生成モデル「Dresscode」と共に、SIGGRAPH 2024の最優秀論文賞にノミネートされました。同チームは、この分野で唯一、同じ最高峰の学術カンファレンスで2つのノミネートを獲得した中国チームとなりました。 Clay の導入により 3D 生成の品質が大幅に向上し、現在の学術界では大規模な 3D モデルに対する技術的アプローチとして広く認識されるようになりました。 △ ClayとDressCodeがSIGGRAPH 2024で最優秀論文賞を受賞 CLAYをベースとした3Dアセット生成ツール「Rodin Gen-1」が昨年6月にリリースされました。その生成効果は「Production-Ready(実稼働レベル)」に最も近いことから、発売以来大きな注目を集めています。 そのビルドクオリティと使いやすさは、当時の類似製品をはるかに凌駕していました。優れたビルドパフォーマンスのおかげで、Rodinはわずか45日で100万ドルのARRを達成しました。一方、有名なHeyGenは、同じ数字に到達するのに7ヶ月かかりました。 その背景には、Yingmou の「生産準備完了」への揺るぎない追求があります。 「プロダクションレディ」という用語はCG業界に由来しています。CG業界では「ポストプロダクション」という用語があり、「プロダクションレディ」は後続のワークフローに直接統合できることを意味します。 これは、Yingmouの製品研究開発におけるコンセンサスでもあります。このコンセンサスこそが、Yingmouが大型3Dモデルの開発に着手した際に「非コンセンサス」の道を歩み始めたきっかけです。 当時、 2Dから3Dへのアップスケーリング技術は学術界における主流の3D生成方法であり、同時に、いくつかのチームがすでに2Dアップスケーリング技術パスに基づいた3D生成製品を発売していました。 しかし、長年の技術探求と製品開発の経験に基づき、Yingmouは2Dから3Dへのアップグレードパスにおけるボトルネックを認識していました。2Dデータは結局のところ、実物の片面しか記録しておらず、画像をどれだけ多くの角度から撮影しても、3Dコンテンツを完全に記述することはできません。そのため、モデルは依然として多くの欠落情報を学習し、生成された結果には依然として多くの手動修正が必要となり、ユーザーのニーズを満たすことが困難です。唯一の解決策は、最初からネイティブ3Dデータを使用することです。 当時、Yingmouは急速に悪化する資本環境により資金調達に失敗しており、難しい選択を迫られていました。 問題は、まずは主流の技術を使って製品を作り、それを世に出すのか、それともまだよくわかっていない技術にもっと力を入れて格闘するのか、ということだ。 Yingmou チームは後者を選択しました。これはより困難で、より多くの時間を必要としましたが、正しい選択でした。 7 か月後、彼らの正確な直感とテクノロジーに対する粘り強さが実を結びました。 Rodin Gen-1.5のリリースは、Shadowmooの「Production-Ready(生産対応)」へのコミットメントをさらに示すものです。新世代のネイティブ3D表現により、Rodin Gen-1.5は、業界における長年の課題である薄面とエッジのシャープネスを包括的に解決し、業界全体の3D生成における商用基準を再び引き上げます。 無機的な形状、シャープなエッジ、そして驚くほどクリーンなトポロジーを生成する能力は、Rodin 1.5が3D生成において提供する最も顕著なパフォーマンス向上です。これは特にゲーム、そしてさらに重要な点として製品デザインにおいて重要です。このアップグレードにより、Shadowmooの製品における優位性はさらに拡大します。 ゲームとアニメーションのワークフローに入りました。Rodin のジオメトリと PBR マテリアルの正確な生成機能により、ユーザーはさまざまなシナリオに適した 3D アセットをすばやく作成できるようになりました。 ユーザーはすでに、ゲーム作成を支援するロディンの機能をテストしています。 単一の静的オブジェクトを直接生成できるメソッドがあります。 △出典: X.com @MartinNebelong 大規模なシーンで NPC を一括生成する方法もあります。 実際、一部のユーザーは、Rodin によって生成された結果をすでに独自のゲームに組み込んでいます。 個々の開発者の中には、Rodin をベースにした完全なワークフローを構築した人もいます。 △出典:ビリビリUPマスターT-BOY アニメーションや映画制作もロダンの主な用途です。 あるユーザーは、ロダンによって生成されたアセットを使用して町全体を構築し、簡単なアニメーションを作成しました。 △出典:X.com @jungle_jimjim 一部のユーザーは、これを既存の AI アプローチと組み合わせて、オフライン エンジンで高品質の CG コンテンツを作成しています。 △出典: X.com @Itryandlearn3D いくつかの調整を加えるだけで、ロダンの資産は映画品質の基準に達することも可能です。 △出典:ビリビリUPマスターT-BOY 3D 大規模モデルが「ChatGPT の瞬間」を迎えるのはいつでしょうか?Yingmou 氏は、Rodin-Gen 1.5 より前では、大規模な 3D モデルの開発は主に 2 つの段階を経ていたと考えています。
Rodin Gen-1.5 のリリースにより、大規模 3D モデルがレベル 3 に到達し、生成されたモデルのより正確で詳細な表現が可能になり、大規模 3D モデルに関する長年の問題が解決され、大規模 3D モデルのアプリケーション境界が大幅に拡大されました。 ここ数年、生成AIはテキスト、画像、音声、動画処理において飛躍的な進歩を遂げており、3D生成は「世界モデル」の「最後のピース」と捉えられることが多くなっています。技術の進歩と消費者需要の高まりにより、3D業界は将来が有望視されています。昨年は、Autodesk、Meta、NVIDIA、Tencent、Microsoftなどが独自の大規模3D生成モデルを発表し、この最先端分野への積極的な進出を図りました。業界大手との競争において、Yingmouチームは3Dモデリング/グラフィックスに関する深い専門知識と3D業界のユーザーニーズへの深い理解により、技術面と商業化の両面で長期にわたりリードを維持してきました。 3D生成には、将来的にも探求の余地が大いにあります。AR/VR/仮想世界におけるパーソナルクリエイションを実現するには、ユーザーの3Dコンテンツ作成能力を最大限に引き出す必要があります。世界は3次元空間に構築されるため、将来、機械による世界の理解は必然的に3次元に基づくものとなるでしょう。そのため、身体性知能の分野において、3Dへの需要は常に存在し続けるでしょう。 Yingmou Technology などの 3D 大規模モデル チームの共同の努力により、3D 分野に「ChatGPT」の瞬間が間もなく到来すると信じています。 |
中国製の3D大型モデルが、世界のインターネットで話題沸騰中!外国人も新年を祝う代わりに、実際に試作しているほどです。
関連するおすすめ記事
-
[Triton チュートリアル] Fused Attention
-
2024 OSCAR オープンソース業界カンファレンス | オープンソース プロジェクト コミュニティおよび商業化フォーラムのハイライト!!!
-
OpenAIが突如オープンソース計画を発表:エッジモデルかスモールモデルか選べ!ウルトラマンがオンライン投票を呼びかけ。
-
長らく行方不明だったゲーム界の伝説、李牧がビリビリでのアップデートを再開し、ラマ 3.1 論文の朗読をリードし、ラマ 3.1 アリーナで 3 位にランクされました。
-
いつでもお手伝いします: 12 月のチーム学習がここにあります!
-
幸運な人の未使用の 4090 により、GPU のレンタル価格が下がりました (doge)。