|
旧正月に帰省する皆様、「AI搭載お正月グッズ」第一弾はあなた次第!村や町をAIで繋ぐ大仕事は、あなた次第です! 最近では、春節の時期に親戚を訪ねに出かけると、 「彼氏/彼女はいますか?」とよく聞かれます。 躊躇せず、すぐに助けを求めてください! ビデオリンク: https://mp.weixin.qq.com/s/kk..._lynuqA?token=2036354970&lang=zh_CN 「ビジネスはどう? 」と聞かれたら、「順調だよ」と答えるだけです。信じられない? 友人たちの話をいくつか紹介しましょう。 ビデオリンク: https://mp.weixin.qq.com/s/kk..._lynuqA?token=2036354970&lang=zh_CN 方言が理解できないという心配は無用です。この携帯電話では、簡単にリアルタイム字幕をオンにすることができます。 さらに、親友が春節に「お正月旅行」に行きたいと言ったら、さっそく「それ」を披露してその腕前を披露しましょう。食事、飲み物、エンターテイメント、そして旅行の計画は「それ」の得意分野です。 ビデオリンク: https://mp.weixin.qq.com/s/kk..._lynuqA?token=2036354970&lang=zh_CN 蚌埠に定住しました!合計34の「それ」があり、それぞれ異なる省レベルの行政区域に属しており、全員が流暢な地元の方言を話します。 春節に「それ」を家に持ち帰りましょう。このAIの小さな男は、ほんの少しの傷で動き出し、方言も追加されるので「村の人たち」との親近感が格段に増します。AIに触れたことのない親戚や友人は戸惑うかもしれません。これで、新年の話題が一つ増えるでしょう。 私が言いたいのは、話題を変える時期が来たということです。 それでどうやってプレイするんですか? 今年は34の州を旅しました。これは実は、百度の文心AIエージェントプラットフォームによって用意された、34の省級行政区を代表する高度に擬人化されたAIアバターのギフトパッケージです。百度アプリで「春節AIエージェント」または「AI観光」を検索すると、今すぐプレイできます。 ご存知の通り、今年の春節はユネスコ無形文化遺産の世界遺産登録が成功して以来、初めての春節です。Ctripが発表した「2025年春節観光市場予測レポート」によると、今年の春節期間中の人々の旅行意欲はかつてないほど高まっています。小紅書などのプラットフォームで検索すると、様々な「お正月グルメ旅行」ガイドが見つかり、多くの人がおすすめをリクエストしています。 Baidu の「34 省インテリジェント エージェント」は、すべての人の旅行仲間となるように設計されています。 南へでも北へでも、東へでも西へでも、あらゆる旅程を万全のサービスでサポートいたします。ご要望をお伝えいただければ、細部まで配慮した旅程プランをすぐに作成いたします。 アトラクションのチケットの購入方法を見つけるのにも役立ち、クリックして直接購入ページに移動することもできます。 しかし、このようなテキストと画像の対話は主な焦点ではありません。Baiduは今回、そのインテリジェントエージェントを全く新しいレベルに引き上げました。 入力ボックスの電話ボタンをクリックすると、デジタル ヒューマン エージェントと直接会話できます。 ビデオリンク: https://mp.weixin.qq.com/s/kk..._lynuqA?token=2036354970&lang=zh_CN さらに、これら34人の「ツアーガイド」は、見た目もアクセントも非常に特徴的なので、「オンライン旅行」に出かけない人にとっても、現地の文化や習慣を知る楽しみとなっている。 ビデオリンク: https://mp.weixin.qq.com/s/kk..._lynuqA?token=2036354970&lang=zh_CN 音声通話中に字幕を選択的にオンにしたり、画面をタップして相手の話を中断したりすることもできます。 もちろん、冒頭で示したように、これを使用して、より創造的な遊び方を開発することもできます。 他の方言で話しかけることもできます。個人的にテストしたところ、理解できました。 ビデオリンク: https://mp.weixin.qq.com/s/kk..._lynuqA?token=2036354970&lang=zh_CN それでもまだ十分ではないと感じる場合は、自分で DIY することもできます。 Baidu Wenxin インテリジェントエージェントプラットフォームでは、ワンクリックで同じスタイルを取得し、故郷の方言のインテリジェントエージェントや興味のある垂直インテリジェントエージェントをカスタマイズできます。 もちろん、中国企業だけが実現できる大規模な技術であるAIによる方言学習の背後にある技術は単純ではない。 方言発音の「秘密兵器」を公開その背後には、Baidu の音声技術チームの 2 つの重要な強みがあります。 音声ビッグデータマイニング技術と音声合成ビッグモデル技術が連携し、34省の人物プロファイルによる方言音声の迅速なカスタマイズをサポートします。 音声ビッグデータマイニング技術は、音声合成モデル全体の基盤となります。まず、強力な認識モデルを用いて、以下のような膨大な量の音声データを自動的に処理します。
これにより、音声合成モデルに大規模で高品質の方言データのサポートが提供され、後続の方言音声合成の正確性と自然さが保証されます。 さらに、大規模な音声合成モデルに基づく方言転送合成技術は、異なる方言の合成モデルを汎用化することが難しく、方言ごとに個別のフロントエンド開発が必要となり、リソースの消費量が多くなり、開発サイクルが長くなるなど、従来の合成システムに存在していた多くの問題を解決しました。 この技術は、ビッグデータを巧みに活用して、中国語とさまざまな方言を統一されたモデリングフレームワークに組み込み、転移学習を通じてあらゆる方言とあらゆる音色間の自然でスムーズな切り替えを実現します。 つまり、複数の方言を合成できる汎用モデルをトレーニングすることができ、研究開発コストと時間を大幅に削減できます。 最先端技術の活用により、出力効率が大幅に向上しました。34台のインテリジェントエージェントが同時に稼働し、導入スピードが速かったのも当然です。しかし、百度の音声技術は春節だけのものではありません。 Baidu Voice は複数の分野で大きな進歩を遂げています。百度の音声技術チームは2010年に設立され、豊富な技術的専門知識を蓄積してきました。その音声技術は様々な業界に応用され、あらゆる分野で活躍しています。 例えば、デジタルヒューマンのライブストリーミングにおいて、デジタルヒューマンの音声合成の品質は録音データの品質に大きく依存します。多くの企業では専門的なアンカーデータが不足しており、その結果、カスタマイズされたバーチャルヒューマンの音声合成効果は一般的に低くなります。 Baidu の音声技術チームは、販売重視のスタイルを特徴とするライブ ストリーミング シナリオ専用の音声ライブラリを構築しました。 パーソナライズされた音声合成におけるいくつかの問題点を革新的に解決します。
効果も抜群で、カスタムサウンドライブラリの制作コストが大幅に削減され、わずか数分のデータで人間の声を凌駕するTTSレベルを実現できると評価されています。 さらに、オーディオブック市場において、百度は絵本からオーディオブックまでのエンドツーエンドの自動生成を実現する完全自動化制作プラットフォームを構築しました。 これには、大規模言語モデルに基づくテキスト理解技術を統合し、正確なキャラクター予測、キャラクタープロファイリング、対話感情分析を可能にし、小説関連ビジネスのための統一されたトレーニングフレームワークを確立することが含まれます。 また、さまざまな感情や非言語的特徴(笑い声や鼻息など)の伝達・制御をサポートする表現力豊かな音響モデリング技術も備えており、意味や感情に合わせた人間のような音声合成を生成できます。 さらに、新しい音声を生成する際に、ユーザーは特定の感情やパラ言語的特徴を含むデータを記録しなくても、感情やパラ言語的特徴を備えたキャラクターのダイアログ ライブラリを素早く生成できるため、データベース構築の障壁が大幅に下がります。 自動車のシナリオでは、Baidu は音声強化に視覚情報も取り入れ、顔の唇の動きの特徴と音声信号を統一的にモデル化することで、複雑なシナリオでの音声強化の効果を大幅に向上させ、これまでのシングルモーダルインタラクション体験を完全に変えました。 したがって、今年のクリエイティブなインタラクティブな春節の活動からさまざまな業界の専門的なアプリケーションまで、Baidu の目標はシンプルです。インテリジェントな音声テクノロジーの境界を再構築し、ユーザーにさらに自然でパーソナライズされたインタラクティブな体験を提供することです。 これは私たち一人ひとりの将来の仕事や生活に影響を与える中核的なトレンドでもあります。 ビッグデータ時代において、音声革命はすでに静かに進行しています。あなたやあなたの知り合いがこの技術の可能性と将来性を理解したいなら、まずは百度の春節ギフトパッケージを試してみるのも良いでしょう。 春節を利用して、AI を使って友達や家族が AI 愛好家になるようサポートしましょう。 |
村とAIをつなぐ鍵はこれだ! 34の地域にハイパーヒューマノイドAIエージェントが展開され、その背後にある技術が明らかになった。
関連するおすすめ記事
-
大規模モデル応用の新たな戦場:端末側におけるAI競争の鍵を解き明かす | 端末の知能
-
Looktech が AI スマート グラスをリリース: ノブ操作でイノベーションをリードし、インテリジェントなミニプログラムで無限の可能性を実現します。
-
ダウンロード数11万件突破、OpenThoughts-114k推論データセット公開、初のAI短編ドラマ制作ツールSkyReels-V1登場!高コストと長期制作サイクルに別れを告げよう。
-
Intel の最強サーバー CPU が登場! AI パフォーマンスが 2 倍に!
-
OpenAI初の無料推論モデル「o3-mini」がリリースされました!DeepSeekがウルトラマンに考え直させる:オープンソース化しなかったのは間違いだった。
-
AI搭載のスマートフォンには標準的な答えが備わりました。