|
11月12日、上海で百度世界博覧会(Baidu World 2024)が開催されました。このカンファレンスで、百度グループ執行副社長兼百度AIクラウド事業グループ社長の申當(シェン・ドウ)氏は、AIの新インフラ構築に焦点を当て、百度AIクラウドが大規模モデルとそのアプリケーションを活用した新インフラ構築を通じて、企業のインテリジェント化を加速させる仕組みを紹介しました。 シェン・ドウ氏は、このインフラストラクチャには 2 つの主要コンポーネントがあると述べました。1 つは大規模モデルの微調整およびアプリケーション開発プラットフォームとして機能し、豊富なツールチェーンを顧客に提供する Qianfan プラットフォームです。もう 1 つは、安定した高速で効率的なコンピューティング パワー サービスを顧客に提供する Baige プラットフォームです。
スピーチの全文は次のとおりです。 こんにちは、みんな。 ロビンとハイフェンのプレゼンテーションを聞いた後、大規模モデリングが技術変革から産業変革へと移行しつつあることを誰もが実感できると思います。数え切れないほどのAIネイティブアプリケーションが、デジタル世界、そして現実世界との関わり方を変革しています。 これらのアプリケーションは、企業の「研究、生産、供給、販売、サービス」プロセスのあらゆる側面に浸透し、企業が競争力を高めるための重要な要素となっています。 従来のクラウドコンピューティングは、大規模アプリケーションモデルの急速な開発をサポートできなくなりました。Baidu AI Cloudは、大規模モデルとそのアプリケーションを中心とする全く新しいインフラストラクチャを構築し、企業のインテリジェントなアップグレードを加速させます。 このインフラストラクチャには、2 つの主要コンポーネントがあります。1 つは、顧客による大規模モデルとアプリケーションの開発とサービス提供を支援する Qianfan プラットフォームです。もう 1 つは、顧客に大規模モデルに関連するコンピューティング パワー サービスを提供する Baige プラットフォームです。 まずはQianfanを見てみましょう。 Qianfanは、大規模モデルの微調整とアプリケーション開発のためのプラットフォームとして、豊富なツールチェーンを提供しています。昨年3月のリリース以来、AIネイティブアプリケーション開発の参入障壁を大幅に引き下げました。先ほどRobinが述べたように、すでに77万以上のアプリケーションがQianfan上で開発されています。特にコアエンタープライズシナリオにおけるアプリケーションの深化に伴い、私たちはQianfanプラットフォームを継続的にアップグレードし、お客様がエンタープライズレベルのアプリケーションを開発するために必要な高いカスタマイズ性、大規模展開、高可用性、そして高いセキュリティ要件を満たし、エンタープライズアプリケーションの限界をさらに広げています。 今日の最初のリリースはワークフロー エージェントです。 世の中には多くのものがパターンに従っていることは周知の事実です。企業においては、これらのパターンは業務プロセス、つまり「ルーティン」です。さらに、業務が専門化・複雑化すればするほど、プロセスへの依存度が高まります。現在、企業における業務プロセスのほとんどは経験レベルにとどまっており、デジタル化が進んでも、従来のワークフロー構成では、システムはあらかじめ定められた手順に従って機械的にタスクを実行することしかできません。しかし、QianfanのWorkflow Agentは、大規模モデルの強力な意図理解と汎化能力を活用することで、これらのプロセスを柔軟なインテリジェントエージェントへと直接変換することができます。業界の専門家のように、これらの「ルーティン」を完全に理解・習得し、情報に基づいた意思決定を行い、状況の複雑さに関わらず、最終的にタスクを完了することができます。 まだ少し抽象的なので、具体的な例を見てみましょう。 自動車保険を例に挙げましょう。自動車保険はリスク対策として、すべての自動車所有者にとって非常に重要です。保険契約の更新時期になると、複雑な価格比較や契約手続きを何度も繰り返す必要があり、場合によっては1~2ヶ月かかることもあります。この長い期間、営業担当者は自動車所有者が安心して安心していただけるよう、専門的かつ綿密なコンサルティングサービスを継続的に提供する必要があります。そのため、営業担当者への要求は非常に高く、多くの営業担当者は完璧なパフォーマンスを発揮できていません。 画面に映っているのは、保険のお客様から伺った「自動車保険の更新」の営業前業務の「業務マニュアル」です。3つの段階と8つのステップに分かれており、それぞれのステップには膨大な数の書類とサブプロセスが含まれており、非常に複雑です。このようなトップセールスマンを育成するには、企業全体で少なくとも1~2年はかかるでしょう。 Qianfan プラットフォームを使用すると、わずか 1 時間で販売前の知識に精通したインテリジェント エージェントを生成できます。 さて、Qianfanに入りましょう。全く新しいワークフローエージェントを作成することもできますが、時間を節約するために、事前に設定されたソリューションをご紹介します。
このエージェントが見つかりました。「編集」をクリックしてキャンバスに入ります。「トップセールスマン」ワークフローはすでに完全に設定されており、各ノードは調整および設定可能です。「公開」をクリックするだけで、このワークフローエージェントがオンラインになります。 Baidu 検索、WeChat 公式アカウント、企業の公式 Web サイトやビジネス システムなど、ユーザーにリーチする必要があるあらゆる場所に簡単に統合できます。 これを当社のインテリジェントカスタマーサービス製品「Keyue」に統合すれば、電話をかけられる「一流営業マン」になります。では、Keyueのアウトバウンドコールシステムを使って、ステージ上の電話機に電話をかけ、その効果を検証してみましょう。(以下は会話の記録です)
ご覧のとおり、エージェントはこのワークフローを習得しています。 どうやって実現したのでしょうか?テスト環境での画面録画をお見せしましょう。
画面の右側には実際の会話が表示され、左側にはエージェントの意図理解、パス選択、応答検討プロセスが表示されます。 対話中、エージェントはまず私たちの意図を理解しようとし、その意図に基づいて実行する手順を選択し、次に具体的な応答を検討します。 先ほど述べた「高額医療保険」のようなワークフロー外の会話に遭遇した場合、従来のワークフロー製品では対応に窮してしまうでしょう。しかし、当社のワークフローエージェントは、企業のナレッジベースから医療保険に関する情報を統合し、堅牢な「バックアップ」ソリューションを提供します。さらに、最終的には会話を「自動車保険の更新」という本題へと誘導することで、エージェントの「状況をコントロールする」能力を発揮します。 Qianfan のワークフロー エージェントは、企業に「デジタル従業員」を提供する能力を備えており、さまざまな職位の職務に適応し、迅速に拡張し、企業の効率を大幅に向上できることは明らかです。 今お見せした「トップセールスマン」のデモンストレーションは、私たちが保険の顧客とともに行った調査と実践です。 ロビンが先ほどYum Chinaとのパートナーシップについてご紹介しましたが、YumはQianfanプラットフォームとKeyueの初期顧客の一つです。本日は、Yum Chinaの最高技術責任者である張磊氏をお招きし、大規模モデル時代におけるYumの革新的な取り組みについてお話しいただきます。張氏、どうぞお越しください!
張さん、ありがとう! Baidu AI Cloudをお選びいただき、Yum! 様、誠にありがとうございます。皆様のご信頼こそが、私たちが最先端技術を継続的に探求し、お客様に価値を創造し続ける原動力です。 業界のアプリケーションでは、顧客の特定のシナリオで低コストで良好な結果を達成するには、カスタマイズされたモデルが必要になることが多いことが分かっています。 Qianfan プラットフォームでは、パラメータ スケールが小さい基本モデルを微調整することで、顧客はわずか数時間で、パラメータ スケールがはるかに大きい基本モデルよりも特定のビジネス シナリオで優れた結果を達成できます。 ある程度、ファインチューニングされたモデルの数は、大規模モデルと業界との統合の深さを反映していると考えています。この数は今年特に急速に増加しました。 Baiduの社内業務だけでも、毎日200件のモデルの微調整が行われています。Qianfanでは、毎日15億回の大規模モデル呼び出しの半分以上が、これらの微調整されたモデルから行われています。 Qianfan 3.0は包括的なツールチェーンを提供し、DPOやKTOといったモデル学習手法を導入できる業界初のプラットフォームです。高品質な汎用コーパスデータと、すぐに使えるモデルの微調整テンプレートを独自に提供します。独自のデータを用意したい場合、微調整を行いたい場合、あるいはすぐに開始して業界のベストプラクティスを再現したい場合など、Qianfanは効率的なサポートを提供します。 私たちのクライアントであるQuanzhen Medicalは、医療AIイノベーション企業です。同社のAI搭載インテリジェント医療アシスタントは、既に50以上の一流病院と15,000以上の中小規模の医療機関に導入されています。
このアシスタントの重要な機能の一つは、AIを活用して、医師が医療記録の整理や作成に費やしていた時間を大幅に節約することです。医師の診察中に会話をリアルタイムで記録し、様々な方言や医学用語を正確に理解します。診察後、わずか2秒で医療記録の草稿を作成できます。 医療記録の精度と標準化を向上させ、コンテンツの品質をさらに向上させるため、クライアントは20万件の標準化された医療記録を用いてモデルの微調整を行いました。画面左側は微調整前の結果で、口語的で専門的ではない表現がまだ残っています。画面右側は微調整後の結果で、表現がより正確で標準化されています。 モデルを微調整した結果、医療記録生成の精度は45%向上しました。このAI医療アシスタントを使用することで、医療記録の作成時間が短縮され、医師の診察可能患者数は20%以上増加しました。 この成功は、クライアントが豊富な業界データを蓄積し、モデルの微調整に必要な正確なラベル付けを行ったことによるものです。しかし、多くの企業にとって、手作業によるデータラベル付けはコストと時間がかかり、実装も困難です。 本日の 2 つ目の発表であるモデル蒸留ソリューションは、合成データを含む完全なツールチェーンを提供し、モデルの微調整を迅速に開始するのに役立ちます。 Baiduのeコマース向けデジタルヒューマンライブストリーミングプラットフォームを例に挙げましょう。このプラットフォームには、視聴者とのインタラクションや商品紹介に使用される複数の基盤モデルが存在します。 これらが蒸留モデルです。まずERNIE 4.0 Turboを用いて学習データを抽出し、その後、データのフィルタリング、インサイト、そして処理を経て、軽量かつ大規模なERNIE Liteモデルを微調整するためのデータセットを作成します。蒸留モデルはフラッグシップモデルの10%のコストで動作し、非常に高速で、フラッグシップモデルとほぼ同等の性能を実現します。 モデルが稼働した後、デジタルヒューマンライブストリーミングルームでのインタラクション率は11%増加し、売上のコンバージョン率も大幅に向上しました。 一般的に、アプリケーションが稼働すると、貴重なビジネスデータが継続的に生成されます。このデータをモデルにフィードバックし、継続的なモデルイテレーションを通じてモデルのパフォーマンスが向上し、アプリケーションがより強力になります。これは「データフライホイール」と呼ばれるものです。 Qianfan は、完全なデータ フライホイール ソリューションを提供する業界初の大規模モデル プラットフォームであり、データ フライホイールの構築に必要な一連のツールを提供します。 先ほどご紹介した例は、Qianfanのエンタープライズレベルの機能のほんの一部です。実際、Qianfanは金融、ヘルスケア、教育、自動車、産業、輸送など、多くの分野のお客様から広く認められています。もう一つ例を挙げてみましょう。 中国国家電網公司は、経済の生命線とエネルギー安全保障を支える大手中核企業として、インテリジェント技術の革新とトレンドをリードし続けています。 昨年より、中国国家電網公司と当社は、文心ビッグデータモデルと千帆プラットフォームを基盤とし、電力業界の高品質なデータを取り入れた大規模電力業界モデルの基礎フレームワークの構築に共同で取り組んできました。ディスパッチング、設備管理、マーケティングなど6つの専門分野において、ネイティブAIの応用を検討しています。現在、これらのアプリケーションは、電力設備の運用・保守、電力供給サービスといった電力業界の中核シナリオに導入され、成功を収めています。中国国家電網公司は、まもなく関連する成果を正式に発表する予定です。 アプリケーションの導入障壁をさらに下げるため、Qianfanをベースにしたアプリケーションテンプレートをいくつか開発し、直接選択できるようにしました。デジタルヒューマンの例をご紹介します。 先日Xiling 4.0をリリースしました。Xilingの機能がさらに強化されました。たった一言で企業向けの3Dデジタルアバターを生成できるだけでなく、作成したデジタルアバターに命を吹き込み、プロ並みの動画を制作することも可能です! ショートビデオは、ブランドが顧客の興味関心を喚起し、コンバージョンを促進する効果的な手段であることは周知の事実です。店舗の主力商品には、ショートビデオが不可欠な場合が多くあります。しかし、ビデオ制作コストは非常に高額です。通常、1本のショートビデオを制作するには、複数のシーンを撮影し、それらを一つ一つ編集する専任チームが必要となり、膨大な作業量となります。しかし、今では大規模モデルとデジタルヒューマンを活用することで、ショートビデオの制作サイクルを分単位に短縮することが可能です。 どうやってやったの?西陵に入ったんだ。 以前、Wensheng 3D デジタル ヒューマンの機能をリリースしました。
すでにご自身のIPキャラクターをお持ちかもしれません。例えば、このような衣装を販売したいとします。3Dデザインファイルを直接インポートすれば、短時間で衣装を変更できます。3Dファイルがなくても、Xilingプラットフォームを利用すれば、クライアントは素早く衣装を作成できます。 次に、ビデオを生成します。
動画生成のための要件ドキュメントは非常に長くなることがあります。要件を一つ一つ分解する代わりに、ドキュメント全体をXilingに渡すだけで、Xilingは重要な情報を抽出し、すべての要件を理解し、対応するシーンの動画クリップを生成してくれます。 生成された結果を見てみましょう。
かつては専門チームが数日かけて完了させていたタスクが、Xilingにテキストを入力するだけで数分で作成できるようになりました。ブランドのニーズを満たすだけでなく、ブランドコンテンツガイドラインを厳格に遵守しています。まさに「エンタープライズレベル」のサービスを体現しています。 この機能は、1ヶ月強後に招待制のテストに公開されます。ご興味のある方は、Baidu AI Cloud Xiling Platformの公式ウェブサイトをフォローして、ぜひ体験にご参加ください。 アプリケーションの爆発的な成長に伴い、モデルの学習と推論に対する需要も大幅に増加しています。コンピューティングパワーのコストと効率はますます重要になり、モデル能力のアップグレード速度やAIアプリケーションの大規模展開に直接影響を与えています。 効率的なコンピューティング能力をすべての人に提供するために、当社はコンピューティング プラットフォームである Baige も継続的に改良しています。 クラスターの作成と開発実験からモデルのトレーニングとモデルの推論まで、Baige 4.0 は安定した高速で効率的なコンピューティング パワー サービスを顧客に提供します。 大規模モデルのさらなる急速な開発をサポートするために、当社はおそらく業界で最初に 100,000 枚のカードのクラスター機能を改良したベンダーの 1 つです。 2つの問題が解決しました。 課題の一つはチップの供給です。現在、国内のチップ供給は依然として逼迫しており、企業がサプライチェーンのセキュリティとレジリエンスを確保するためには、マルチチップ・クラウドベースのアプローチが不可欠です。数万チップ規模のシステムにおいて、2種類のチップを混合したトレーニングにおける効率低下は5%以内に抑えられ、業界をリードする地位を維持しています。 2つ目の課題は、地域をまたぐデータセンターの展開です。10万台のサーバーからなるクラスターを展開するには、約10万平方メートルの物理的なスペースが必要となり、これは現在使用している会議室35室分に相当します。さらに、これらのサーバーは1日あたり約300万キロワット時の電力を消費します。これは北京市東城区の住民の1日の電力消費量に相当します。これほどの広大なスペースと電力消費は、従来の単一データセンターモデルでは対応が困難であり、地域をまたぐ展開はレイテンシの問題を引き起こします。効率的なトポロジ、高性能で輻輳のない地域間ネットワーク、そして効率的な並列モデルトレーニングを提供することで、Baigeは数十キロメートルに及ぶ複数のデータセンターにまたがる1万台のサーバーからなるクラスターにおいて、単一のトレーニングタスクのパフォーマンス低下を4%以内に抑えることができます。これはまさに業界をリードする技術です。 Baigeは、Baidu社内の顧客に加え、幅広い外部顧客にもサービスを提供しています。パブリッククラウドを活用して迅速な導入を目指す企業から、独自のインテリジェントコンピューティングセンターを構築したい顧客まで、Baigeはあらゆるコンピューティングパワーのニーズに対応します。 私たちは、大規模モデルプラットフォームとコンピューティングパワープラットフォームからなる新たなAIインフラストラクチャを基盤として、フルスタックAIテクノロジーサービスシステムを構築しました。その中核となるのは、QianfanとBaigeで構成されるWanyuanシステムです。これをベースに、様々な業界向けにQianfanの拡張版をリリースし、幅広いエコシステムパートナーと連携して、アプリケーションイノベーションの「ラストワンマイル」を繋いでいます。私たちは、ネイティブAIアプリケーションがB2B市場で爆発的な成長を遂げると信じており、その瞬間は既に到来しています。 知性が無限の可能性を創造できるように、私たちは手を取り合って共に探求しましょう! 皆様ありがとうございました! |
百度の神豆:新たなAIインフラ
関連するおすすめ記事
-
黄(ホアン)氏が5090を発表。価格は1万5000元!世界最小のAIスーパーコンピュータも登場。価格は2万2000元。
-
楊元慶氏が中国サイバースペース管理局に「人間中心のインテリジェンスはテクノロジー企業にとってイノベーションの意義である」という記事を掲載した。
-
DeepSeek V3 が話題になっています。2,000 個の GPU を搭載し、550 万元かけて構築されたこのオープンソース モデルは、数億元かかった OpenAI のモデルと同等の性能を持っています。
-
QuantumBit主催の「MEET 2025 Intelligent Future Conference」が発足しました!年間アワードの応募受付を開始しました。
-
ケリンAIがトロッコ問題を無事に解決!ネットユーザー「これが東洋の知恵?」
-
2024年度「コードフーフカップ」大会表彰式が盛況のうちに開催されました。