|
世界初のAI 搭載ストリーミング音楽アプリが、満を持して登場しました。 その特徴は何ですか? まず、その名前が示す通り、このアプリの音楽はすべて AI によって生成されています。 第二に、これは無限のストリームであり、継続的に生成およびリッスンできることを意味します。 早速、結果を見てみましょう。 たとえば、プロンプトは次のとおりです。 愛犬と一緒にのんびり散歩しましょう。 動画リンク: https://mp.weixin.qq.com/s/30... 上のビデオでは、まず10 分間の音楽を生成しました。 その10分間で、AIは「チル」という感覚を中心に据えた、異なるボーカルの4つの異なる英語の歌を生成した。 雰囲気はそのままで、切り替えもシームレスに行われるため、犬の散歩中に音楽を変えるために立ち止まる必要がありません。 効果とアプリのインターフェースを見た後、この AIGC 製品を開発した外国企業はどこなのか気になりますか? いやいや。 このアプリは、中国企業Kunlun Techが開発した海外の新製品Melodioで、Web版もサポートしています。 では、世界初のAI搭載音楽ストリーミングプラットフォームであるMelodioには、他にどのような機能があるのでしょうか?実際に試してみましょう。 中国語対応のものになります。Melodio は現在主要なアプリ ストアで入手可能で、他の音楽ソフトウェアと同様に、ダウンロードするだけで使い始めることができます。 使い方は非常に簡単です。アプリを開いてログイン(または登録)すると、インターフェースは次のようになります。 最も簡単な方法は、聴きたい音楽のプロンプトを入力し、「Let's vibe」をクリックすることです。 例えば今回は次のように入力します。 ダイナミックな音楽、DJ、フィットネス、情熱。 https://mp.weixin.qq.com/s/30... 全体的に、この音楽にはワークアウトに必要なダイナミックなリズムがあります。 Melodio は、Prompt 経由で直接曲を生成するだけでなく、 「曲参照」モードも提供します。 それでは、今度はプロンプトの難易度を上げて、この海外製品に中国語の歌を生成させてみます。 雨の日の悲しみ(中国語) https://mp.weixin.qq.com/s/30... 楽曲の雰囲気がPromptの要件を満たしているだけでなく、AI歌手の中国語の発音も非常に明瞭で、歌詞を見なくても全く問題ありません。 もちろん、歌詞を確認したい場合は、ホーム画面から右にスワイプするだけです。 生成された音楽を保存する場合は、メイン画面の右下にある小さなハートのアイコンをクリックすると、約 2 分間のオーディオ ファイルが保存されます。 さらに、創造的なインスピレーションが不足している場合や、他の人が作成した音楽を聞きたい場合のために、Melodio の左側の画面にはミュージックスクエア機能も用意されています。 ここでは、明るい曲やエネルギッシュな曲など、さまざまなスタイルのネットユーザーが作成した高品質の AI 音楽を聴くことができます。 しかし公平を期すと、MelodioはKunlun Techが今回発売したAI音楽製品の1つにすぎません。 Suno に勝る AI 音楽作成プラットフォームもあります。そうです、Kunlun TechもMurekaと呼ばれるAI音楽作成プラットフォームを立ち上げました。 Melodio が AI 音楽を聴くのに適しているとすれば、Mureka はAI 生成の音楽をまったく新しいレベルに引き上げます。 操作のハードルも非常に低く、音楽を作成したことがない場合でも、わずか 2 ステップで操作できるので、確実に操作できます。 最初のステップは、曲のタイトルと歌詞を入力することです。 左側の対応する入力ボックスに、事前に用意しておいた曲のタイトルと歌詞を入力します。 △注:曲名と歌詞はAIによって生成されています。 2 番目のステップは、参照音楽を選択することです。 このプロセス中に、プラットフォームに組み込まれている音楽ライブラリから音楽を選択したり、独自のローカル音楽をアップロードしたりできます。 私たちは伝統的な中国風の音楽を生成したいので、参考音楽として『皇后両陛下』のテーマソングである「紅美女の艱難」を選びました。 アップロード後、音楽のスタイル、ムード、リファレンス クリップ (30 秒) をカスタマイズすることもできます。 最後に「作成」をクリックします。約1分後、Murekaは2つのバージョンの音楽を生成します。 バージョン 1 は次のようになります。 https://mp.weixin.qq.com/s/30... バージョン 2 は次のようになります。 https://mp.weixin.qq.com/s/30... Mureka によって生成される音楽は「一回限り」のものではなく、特定のセグメントの二次 AIGC に使用できます。 Murekaが生成する音楽のデフォルトの長さは約2分です。AIにもっと長い音楽を生成させたい場合は、歌詞を追加するだけです。 最も重要なのは、Murekia で生成された音楽は販売可能であり、作成の証明が付属していることです。 しかし、公平に言えば、Mureka のような AI 音楽作成プラットフォームは、その種のものとしては初めてではなく、 SunoやUdioなどの人気のプラットフォームがすでにリリースされています。 それで、どちらが強いですか、それとも弱いですか? この問題に関しては、海外のブロガーがすでに20分近くの動画を公開し、その方法を実演・解説しています。彼はその後、次のように結論づけています。 ムレカはスノやウディオよりも優れています。 それで次の質問です: どうやってそれをやったんですか?クンルンテックもこの問題に対する解決策を提供した。 音楽業界におけるSORAのようなアーキテクチャ。 このアーキテクチャは主に 2 つの部分に分けられます。 1 つ目は、音楽パッチのコンテキスト依存性を学習して音楽を作成し、同時に曲の作成と制御を完了する役割を担う「大規模トランスフォーマー」です。 もう1つのDiffusion Transformerはボーカルパートを担当します。DiTを使用して音楽パッチを高音質に復元し、6分間の44100Hzサンプリングレート、2チャンネルステレオ楽曲の生成をサポートします。 そのため、Kunlun Tech では、このアーキテクチャに基づくモデルの最新の成果も比較しました。 ムレカの新モデルは、音質、自然さ、発音の明瞭度において業界の最先端(SOTA)レベルに達しており、ボーカルパフォーマンスにおいてトップの地位を維持していると理解されています。 同時に、他のより洗練された音楽性指標(モチーフの品質、伴奏のテクスチャ、楽器の豊かさ、音楽構造、ミキシングの品質)も大幅に改善されました。 これが、Melodio と Mureka が数多くのブロガーによる厳しいテストに耐えた製品である理由です。 しかし、最後に議論する価値のある問題が 1 つあります。 そのため、中国企業である崑崙科技は、AI音楽の分野で海外市場を選択したのです。 実際、Kunlun Tech の「履歴書」を詳しく見てみると、グローバル展開は以前から同社の DNA の一部となっており、実に 16 年にわたる経験を積んでいます。 Kunlun Tech の現在の事業は、AGI および AIGC、情報配信、メタバース、ソーシャル エンターテイメント、ゲームなど、複数の分野にわたります。 同社の市場は、中国、東南アジア、アフリカ、中東、北米、南米、そしてヨーロッパに広がっています。現在、全世界で月間アクティブユーザー数は約4億人に達し、海外からの収益は総収益の86%を占めています。 大規模モデルの時代に入ると、Kunlun Tech はこの分野で包括的なグローバル展開を行った最初の企業の 1 つになりました。 同社の子会社であるSkyworkは、AIビッグデータモデル、AI検索、AI音楽、AIビデオ、AIソーシャルネットワーキング、AIゲームなど、6つの主要なAIビジネスマトリックスを網羅しています。 同社の製品である「天宮」アプリは、AI検索、AI読み取り、AI作成などのコア機能を完全に統合しており、仕事、学習、生活など、さまざまな応用シナリオをカバーしています。 だからこそ、AI音楽分野が急速に台頭する中で、Kunlun Techは最先端の能力を備えて海外市場に参入できるのです。 つまり、Melodio と Mureka の正式リリースにより、音楽愛好家が音楽を作成するための参入障壁が大幅に下がりました。 さらに、音楽業界のプロフェッショナルにとっても、これらの AIGC ツールは創造的なインスピレーションに一定の刺激を与えています。 |
世界初の AI 搭載ストリーミング音楽アプリが登場! 中国製。
関連するおすすめ記事
-
ぜひ Datawhale の年次概要をご請求ください。
-
将来を見据えると、openEuler はハブとなります。
-
iFlytek Smart Creation の実際のテスト: たった 1 枚の写真で独自のデジタル アバターをカスタマイズします。
-
オンライン チュートリアル | 最先端の (SOTA) イメージをワンステップで生成: Hyper-SD ワンクリック スタート チュートリアルが利用可能になりました。
-
Meta初のマルチモーダル大規模モデルがワンクリックで起動できます!3万枚以上の画像を含む、初のマルチニードル刺繍データセットがオンラインになりました。
-
Besto Biotech は、ライフ サイエンスの大規模モデルにおける 2,000 億のパラメータ レベルを突破する先駆的な大規模ライフ サイエンス モデルである xTrimo V3 をリリースしました。