|
本日、Modelersは、Step-Video(ビデオ生成)とStep-Audio(音声)が開発したオープンソースのマルチモーダル大規模モデル2つをリリースし、Huawei Ascend CANN異種コンピューティングアーキテクチャとAscendサーバーに基づくモデルの適応を完了したことを発表しました。 開発者や企業ユーザーは、Molo コミュニティで直接ダウンロードして体験できます。 Step-Video-T2Vは現在、パラメータ数において世界最大のオープンソース動画生成モデルであり、300億パラメータに達します。毎秒204フレーム、解像度540pの高品質動画を直接生成できます。 Step-Video-T2Vが以前に発表した評価結果によると、その指示コンプライアンス、動作の滑らかさ、物理的合理性、美しさの面での性能は、市場にある既存の最高のオープンソースビデオモデルを大幅に上回っています。一方、Step-Audioは、さまざまな感情、方言、言語、歌唱スタイル、パーソナライズされた音声スタイルを生成できる、業界初の製品レベルのオープンソース大規模音声インタラクションモデルです。 Jieyue Xingchen は最近行われたエコシステム オープン デーで、3 月にグラフ生成ビデオ モデルもオープンソース化することを明らかにしました。 中国電信クラウドとファーウェイが共同で構築したMoloコミュニティは、AI開発者やテクノロジー愛好家に対し、モデル、データセット、開発ツールチェーン、アプリケーションのためのワンストップホスティングおよびデモンストレーションサービスを提供しているとのことです。モデルとアプリケーションのデモンストレーションを容易にするため、コミュニティは無料のコンピューティングパワーサポートも提供しており、ユーザーは複雑な環境設定を必要とせずに、オンラインでモデル推論を体験し、AIソリューションを迅速に検証できます。 現在、主要な技術コミュニティは、Jieyue Xingchenの2つのオープンソースマルチモーダルモデルをリリースしています。Moleコミュニティに加え、ModelScopeコミュニティ、Gitee AI、HuggingFace、Replicateプラットフォームでも体験できます。 さらに、Jieyue Xingchenオープンソースは、チップ企業、クラウドベンダー、スマート端末メーカー、クリエイタープラットフォームなどの注目を集めています。天樹智信、アリババクラウド、Volcano Engine、TCL、LiblibAI、Huanrui Centuryなど、各業界のベンチマーク企業がJieyue Xingchenオープンソースエコシステムに参加しています。 |
Step Starry Sky プラットフォームに適合した Huawei Ascend のマルチモーダル オープンソース モデルが、Molo コミュニティでリリースされました。
関連するおすすめ記事
-
楼嬌がIPOを目指す!売上高12億元を公開、ロボタクシー銘柄第1号を目指す。
-
初のハイブリッド推論モデル「Claude 3.7」がリリースされました!優れたプログラミング能力を誇り、思考時間のコントロールも可能です。
-
Nature 認定の DeepSeek を万能研究ツールとして活用:国内の大学は大規模モデルをどう活用できるのか?
-
量子力学100周年:物理学に革命をもたらす迅速な戦い | Nature
-
2世代にわたる自動車用チップは360億ドルの収益を生み出したが、Nvidiaが単独で利益を上げていた時代は終わった。
-
画期的なLAB-Bench生物学的ベンチマークデータセットがオープンソースとしてリリースされました!8つのタスクをカバーし、2,400問以上の多肢選択式問題が含まれています。