|
本日、Modelersは、Step-Video(ビデオ生成)とStep-Audio(音声)が開発したオープンソースのマルチモーダル大規模モデル2つをリリースし、Huawei Ascend CANN異種コンピューティングアーキテクチャとAscendサーバーに基づくモデルの適応を完了したことを発表しました。 開発者や企業ユーザーは、Molo コミュニティで直接ダウンロードして体験できます。 Step-Video-T2Vは現在、パラメータ数において世界最大のオープンソース動画生成モデルであり、300億パラメータに達します。毎秒204フレーム、解像度540pの高品質動画を直接生成できます。 Step-Video-T2Vが以前に発表した評価結果によると、その指示コンプライアンス、動作の滑らかさ、物理的合理性、美しさの面での性能は、市場にある既存の最高のオープンソースビデオモデルを大幅に上回っています。一方、Step-Audioは、さまざまな感情、方言、言語、歌唱スタイル、パーソナライズされた音声スタイルを生成できる、業界初の製品レベルのオープンソース大規模音声インタラクションモデルです。 Jieyue Xingchen は最近行われたエコシステム オープン デーで、3 月にグラフ生成ビデオ モデルもオープンソース化することを明らかにしました。 中国電信クラウドとファーウェイが共同で構築したMoloコミュニティは、AI開発者やテクノロジー愛好家に対し、モデル、データセット、開発ツールチェーン、アプリケーションのためのワンストップホスティングおよびデモンストレーションサービスを提供しているとのことです。モデルとアプリケーションのデモンストレーションを容易にするため、コミュニティは無料のコンピューティングパワーサポートも提供しており、ユーザーは複雑な環境設定を必要とせずに、オンラインでモデル推論を体験し、AIソリューションを迅速に検証できます。 現在、主要な技術コミュニティは、Jieyue Xingchenの2つのオープンソースマルチモーダルモデルをリリースしています。Moleコミュニティに加え、ModelScopeコミュニティ、Gitee AI、HuggingFace、Replicateプラットフォームでも体験できます。 さらに、Jieyue Xingchenオープンソースは、チップ企業、クラウドベンダー、スマート端末メーカー、クリエイタープラットフォームなどの注目を集めています。天樹智信、アリババクラウド、Volcano Engine、TCL、LiblibAI、Huanrui Centuryなど、各業界のベンチマーク企業がJieyue Xingchenオープンソースエコシステムに参加しています。 |
Step Starry Sky プラットフォームに適合した Huawei Ascend のマルチモーダル オープンソース モデルが、Molo コミュニティでリリースされました。
関連するおすすめ記事
-
登録受付開始!今年最も注目すべきAIGC企業・製品を選出中。
-
PLMにおける大きな進歩!上海交通大学と上海AIラボの最新の成果がNeurIPS 24に選出されました。ProSSTはタンパク質構造情報を効果的に統合します。
-
OpenAIが新たな中国人研究者を募集中!彼は高校時代にアメリカの「ジュニア・ノーベル賞」の最終候補に選ばれ、現在はハーバード大学で教鞭を執っています。
-
BaiChuan Intelligent は、企業が「より効率的、より高速、より優れ、よりコスト効率の高い」大規模モデルを実装できるようにするためのワンストップ ソリューションをリリースしました。
-
81万5000円!Xiaomi SU7 Ultraが予約受付開始。雷軍氏「ポルシェ・タイカンを完全に凌駕する」
-
awesome-ai4s がオープンソースになりました!科学のためのAIに関する200以上の最先端の学術論文を中国語訳付きでまとめたもので、継続的に更新されています。