|
本日、Modelersは、Step-Video(ビデオ生成)とStep-Audio(音声)が開発したオープンソースのマルチモーダル大規模モデル2つをリリースし、Huawei Ascend CANN異種コンピューティングアーキテクチャとAscendサーバーに基づくモデルの適応を完了したことを発表しました。 開発者や企業ユーザーは、Molo コミュニティで直接ダウンロードして体験できます。 Step-Video-T2Vは現在、パラメータ数において世界最大のオープンソース動画生成モデルであり、300億パラメータに達します。毎秒204フレーム、解像度540pの高品質動画を直接生成できます。 Step-Video-T2Vが以前に発表した評価結果によると、その指示コンプライアンス、動作の滑らかさ、物理的合理性、美しさの面での性能は、市場にある既存の最高のオープンソースビデオモデルを大幅に上回っています。一方、Step-Audioは、さまざまな感情、方言、言語、歌唱スタイル、パーソナライズされた音声スタイルを生成できる、業界初の製品レベルのオープンソース大規模音声インタラクションモデルです。 Jieyue Xingchen は最近行われたエコシステム オープン デーで、3 月にグラフ生成ビデオ モデルもオープンソース化することを明らかにしました。 中国電信クラウドとファーウェイが共同で構築したMoloコミュニティは、AI開発者やテクノロジー愛好家に対し、モデル、データセット、開発ツールチェーン、アプリケーションのためのワンストップホスティングおよびデモンストレーションサービスを提供しているとのことです。モデルとアプリケーションのデモンストレーションを容易にするため、コミュニティは無料のコンピューティングパワーサポートも提供しており、ユーザーは複雑な環境設定を必要とせずに、オンラインでモデル推論を体験し、AIソリューションを迅速に検証できます。 現在、主要な技術コミュニティは、Jieyue Xingchenの2つのオープンソースマルチモーダルモデルをリリースしています。Moleコミュニティに加え、ModelScopeコミュニティ、Gitee AI、HuggingFace、Replicateプラットフォームでも体験できます。 さらに、Jieyue Xingchenオープンソースは、チップ企業、クラウドベンダー、スマート端末メーカー、クリエイタープラットフォームなどの注目を集めています。天樹智信、アリババクラウド、Volcano Engine、TCL、LiblibAI、Huanrui Centuryなど、各業界のベンチマーク企業がJieyue Xingchenオープンソースエコシステムに参加しています。 |
Step Starry Sky プラットフォームに適合した Huawei Ascend のマルチモーダル オープンソース モデルが、Molo コミュニティでリリースされました。
関連するおすすめ記事
-
「AIネイティブ」の小学生第1期生が大規模モデルを開発中。
-
DingTalk は、作業指示を含む 6 つの主要シナリオ向けの AI アシスタントをリリースし、業務運営への AI の統合をさらに進めています。
-
iFlytek は、iFlytek Smart Writing 2.0 の新バージョンの正式リリースを発表しました。
-
王伝富氏は自動車の製造に満足せず、人型ロボットの開発を希望しており、世界的な研究開発チームを募集している。
-
LLMベースのエージェントに関する詳細な記事
-
小さな模型が立ち上がり、ブラウザにSOTA(State of Data)の結果が表示されました。(顔面を手で覆う)逃げろ!合成データに未来はない!