|
本日、Modelersは、Step-Video(ビデオ生成)とStep-Audio(音声)が開発したオープンソースのマルチモーダル大規模モデル2つをリリースし、Huawei Ascend CANN異種コンピューティングアーキテクチャとAscendサーバーに基づくモデルの適応を完了したことを発表しました。 開発者や企業ユーザーは、Molo コミュニティで直接ダウンロードして体験できます。 Step-Video-T2Vは現在、パラメータ数において世界最大のオープンソース動画生成モデルであり、300億パラメータに達します。毎秒204フレーム、解像度540pの高品質動画を直接生成できます。 Step-Video-T2Vが以前に発表した評価結果によると、その指示コンプライアンス、動作の滑らかさ、物理的合理性、美しさの面での性能は、市場にある既存の最高のオープンソースビデオモデルを大幅に上回っています。一方、Step-Audioは、さまざまな感情、方言、言語、歌唱スタイル、パーソナライズされた音声スタイルを生成できる、業界初の製品レベルのオープンソース大規模音声インタラクションモデルです。 Jieyue Xingchen は最近行われたエコシステム オープン デーで、3 月にグラフ生成ビデオ モデルもオープンソース化することを明らかにしました。 中国電信クラウドとファーウェイが共同で構築したMoloコミュニティは、AI開発者やテクノロジー愛好家に対し、モデル、データセット、開発ツールチェーン、アプリケーションのためのワンストップホスティングおよびデモンストレーションサービスを提供しているとのことです。モデルとアプリケーションのデモンストレーションを容易にするため、コミュニティは無料のコンピューティングパワーサポートも提供しており、ユーザーは複雑な環境設定を必要とせずに、オンラインでモデル推論を体験し、AIソリューションを迅速に検証できます。 現在、主要な技術コミュニティは、Jieyue Xingchenの2つのオープンソースマルチモーダルモデルをリリースしています。Moleコミュニティに加え、ModelScopeコミュニティ、Gitee AI、HuggingFace、Replicateプラットフォームでも体験できます。 さらに、Jieyue Xingchenオープンソースは、チップ企業、クラウドベンダー、スマート端末メーカー、クリエイタープラットフォームなどの注目を集めています。天樹智信、アリババクラウド、Volcano Engine、TCL、LiblibAI、Huanrui Centuryなど、各業界のベンチマーク企業がJieyue Xingchenオープンソースエコシステムに参加しています。 |
Step Starry Sky プラットフォームに適合した Huawei Ascend のマルチモーダル オープンソース モデルが、Molo コミュニティでリリースされました。
関連するおすすめ記事
-
開発者がオープンソースについて議論:KWDBオープンソースデータベースの将来の道筋とエコシステム構築の実践
-
Qualcomm の最新の 5G チップは AI に優れています。
-
10 人のチームが 10 億ドルを調達。Ilya の最新インタビュー: Scaling Law は静止した存在ではない。
-
最強の数理モデルがついに登場!アリババの1000 Questions新モデルはGPT-40を上回る性能を誇り、ネットユーザーからは「これぞ真の『ストロベリー』モデル!」と絶賛の声も!
-
ChatGPT の新しい使い方が話題になっています。それは、あなたの実生活を一文で描写することです。専門家の Karpathy 氏はすでにこれを活用しています。
-
Phi 3.5 mini+vision をワンクリックで導入! マルチモーダル読解ベンチマークデータセット MRR-Benchmark がオンラインになりました。550 組の質問と回答が含まれています。