618ZXW

Baidu AI Cloud が大規模モデル展開の成果を披露: 5 つの初物!

中国No.1大型模型プラットフォーム市場!

大規模モデルの普及初年に、百度の最新業績レポートが発表されました

  • 中国大型モデル市場シェアNo.1
  • 中国No.1大型模型製品レイアウト
  • 中国最大のモデル製造業は最大の工業化規模を誇ります。
  • 落札件数、落札額、対象業種数、中央企業・国有企業案件数において上半期第1位。
  • Wenxin の大規模モデルでは、1 日の呼び出し回数が 7 億回を超えます。
  • Qianfan プラットフォームには、30,000 を超える微調整されたモデルと 700,000 を超える開発されたアプリケーションがあります。

最近開催された百度クラウドインテリジェンスカンファレンスにおいて、百度スマートクラウドは市場での成果を披露しただけでなく、サムスンや中国南方電力網などの大手業界クライアントの注目を集め、そのアプリケーションの実際的な効果を実証しました。

この動きは驚くべきものではありません。9月にはクラウドベンダーが次々と製品やサービスをリリースしました。モデルやアルゴリズムを披露していた昨年とは異なり、今年はアプリケーションや業界価値について議論することに関心が集まっています。

大規模モデルのトレンドは、実際の結果が自らを物語る段階に急速に到達しつつあります。

なぜ百度AIクラウドが「最高入札者」になったのか?まずは最新の発表から見ていこう。

基盤となるコンピューティングから上位層のアプリケーションまで、5 つの製品すべてが全面的にアップグレードされました。

今年の Baidu Cloud Intelligence Conference では、5 つの AI 製品のアップグレードが紹介されました。

  • 基盤となるインフラストラクチャ: Baige 4.0 がリリースされました。
  • 中間モデルおよび開発ツール層: Qianfan Large Model Platform 3.0 がリリースされました。
  • すぐに使用できるトップレベルの AI アプリケーション: Keyue、Xiling、Wenxin Quick Code。

これらを組み合わせることで、企業の大規模モデルの産業応用のためのフルスタック機能が構成され、大規模モデルを適用する企業のさまざまなニーズにも応えることができます。

まず、大規模モデルの実用化に不可欠な基盤となるコンピューティングインフラストラクチャについて見てみましょう。Baige AIヘテロジニアスコンピューティングプラットフォームはバージョン4.0を正式にリリースしました

ハイブリッドマルチコアテクノロジーを基盤とし、下からリソース層、コンポーネント層、加速層、ツール層に分かれており、企業に統合された大規模モデルのトレーニングおよびプロモーションサービスを提供します。

このリリースでは、Baige 4.0 はクラスター作成、開発実験、モデルトレーニング、モデル推論の面でアップグレードされ、大規模モデルを使用する企業の全プロセスをカバーし、企業ユーザーが懸念する多くの重要な指標に大きな改善をもたらしました。

アップグレードの詳細については、以下を参照してください。

次に、主に企業に生成AIの制作とアプリケーション開発の全プロセスのためのツールチェーンを提供する大規模モデルプラットフォームQianfanを見てみましょう

Qianfan Large Model Platform 3.0 では、アプリケーション開発層、モデル サービス層、モデル開発層が全面的にアップグレードされました。

アプリケーション開発層では、Qianfan Large Model Platform 3.0 は、エンタープライズ レベルの RAGエンタープライズ レベルの Agent開発を全面的にサポートし、エンドツーエンドのアプリケーション開発ツールAI Quick Buildもリリースしました。

エンタープライズグレードのRAGは、無制限のナレッジベースストレージをサポートし、1.5秒以内に結果を返します。解析、スライス、ベクトル化、リコール、ソートなど、RAG​​のあらゆる側面は調整および制御可能です。企業は、自社のビジネスに最適なソリューションを柔軟に構成できます。

QianfanのエンタープライズグレードのRAGを搭載したThe Paperは、膨大なメディアアセットライブラリからコンテンツを迅速かつ正確に取得できます。これにより、「ビッグモデル錯覚」の問題を効果的に回避し、企業は自社の運用環境内で大規模なモデルを自信を持って活用し、結果を取得して回答を得ることができます。

エンタープライズレベルのエージェントは、大規模モデルを展開するためのもう一つの一般的な方法です。大規模モデルが自律的に思考し、タスクを細分化し、その後ツールを呼び出してプロセス全体を自動化できるようにします。

エンタープライズレベルのエージェントは、文心シリーズと百度の様々な垂直モデルをサポートし、さらに百度検索や百度地図などの公式コンポーネントもサポートします。また、長期短期記憶もサポートしており、エージェントはユーザーとの会話内容を記憶することができます。

例えば、国慶節の連休中に3日間の山西省旅行を計画するようエージェントに依頼します。計画では、『黒の神話:悟空』に登場する山西省の名場面を参考にし、エージェントは500元以下の予算で、質が高くコストパフォーマンスに優れた高評価のホテルに宿泊し、自家用車でのルートを計画する必要があります。

ご覧のとおり、エージェントはさまざまなアプリを切り替えて、人間のようにタスクを実行し、タスクを分解、計画、実行することができます。

AI Quick Builderは、たった一文でアプリケーションの作成をサポートします。チャットまたはPRD(製品要件ドキュメント)のアップロードでアプリケーションを生成できるため、資産管理やCRMといったエンタープライズレベルのアプリケーションをゼロコードで作成できます。

これまで数名で数日かかっていたアプリケーション開発が、対話を通じて数分で完了します。開発経験のないビジネスパーソンでも、簡単に開発に着手できます。

さらに、ユーザーは自然言語の対話を通じて要件を変更したり、モジュールを追加または削除したりすることができます。

現在、千帆大型モデルプラットフォームを通じて開発されたアプリケーションの数は70万を超えています。

優れたアプリケーション開発には、基本的な機能を提供する優れたモデルが必要です。

Qianfan モデル サービス レイヤーは、大規模な言語モデルと従来のモデルをカバーする、豊富な大規模モデル セットを提供します

実際には、従来の NLP モデルと CV モデルに対する市場の需要は依然として高く、大規模なモデルと小規模なモデルを組み合わせて使用​​することは非常に一般的です。

そのため、千帆大型モデルプラットフォーム3.0では、利用可能なモデルがさらに充実し、主に百度が自社開発した文​​心シリーズに加え、新たに音声シリーズ機能モデルとビジョンシリーズモデルが追加されました。

Qianfan Large Model Platform 3.0 では、次のモデルが提供されます。

モデル開発レイヤーは、最も包括的なツールチェーンを提供します。

DPO、KTOなどのモデルトレーニングアルゴリズム、PTQなどのモデル量子化アルゴリズムが含まれており、超大規模モデルの微調整とカスタマイズを効率的にサポートできます。

また、CV、NLP、音声などの従来のモデルの開発もサポートしており、データ、モデル、コンピューティング リソースの統合管理とスケジュール設定が可能になり、あらゆる規模のモデルを開発するためのワンストップ エクスペリエンスを企業に提供します。

最後に、AIアプリケーション層について見てみましょう

Cloud Intelligence Conference では、主に 3 つの AI アプリケーション製品のアップデートが紹介されました。

  • Keyue: 大規模モデル再構築に基づく中国初のインテリジェント顧客サービス製品。
  • Xiling: 中国初の大規模モデルベースのデジタル人間再構築プラットフォーム。
  • Wenxin Quick Code: インテリジェント コード アシスタント。

Keyueは、マルチモーダルインタラクション機能、多言語対応機能、そしてエンドツーエンドのインサイト機能をアップグレードしました。わずか3ステップで、スマートなカスタマーサービスチームを構築できます。

動画、音声、テキスト入力をサポートするマルチモーダルなインタラクティブなカスタマーサービスエクスペリエンスにより、説明が難しい問題も容易に解決できます。例えば、ユーザーはダッシュボードの写真を撮って直接質問することができます。また、中国語と英語の両方のドキュメントでQ&Aもサポートしています。

導入された大規模カスタマーサービスインサイトエージェントは、ユーザーのフィードバックと会話プロセスを分析できます。意図理解、主要情報抽出、感情抽出を通じて、企業は顧客理解をさらに深めることができます。BMW LingyueやGM Chinaなどの企業は既にこの機能を採用しています。

Xiling 4.0では、機能強化と同時にコストのさらなる削減も実現しました。

現在、1時間ごとの2Dヒューマノイド・スーパーヒューマノイド・デジタルヒューマンの生成、1文の3Dデジタルヒューマン(10分)の生成、ライブビデオ放送の置き換え、リアルタイムのインタラクティブダイアログ、ライブストリーミングなどの機能をサポートしています。

一方、2Dおよび3Dデジタルヒューマンのアプリケーションコストはさらに低下し、わずか199元で、数万元から数百元へと価格が下がり、超リアルな3Dデジタルヒューマンをカスタマイズできるようになりました。

また、AppBuilder がアクセスできるオープンなデジタル ヒューマン コンポーネント プラットフォームも提供し、迅速な統合を容易にするために軽量の SDK と標準化されたインターフェースをサポートしています。

今では、誰もがミニプログラムを通じて独自のデジタルペルソナを構築できます。

Wenxin Quick Code (インテリジェント コード アシスタント) は、大規模なモデル テクノロジを統合し、リアルタイムの推奨、コード生成、コード レビュー、コード最適化などの機能を提供します。

このリリースには、エンタープライズ レベルのコード アーキテクチャの説明、エンタープライズ レベルのコード レビュー機能、およびエンタープライズ レベルのコード支援機能が含まれています。

これらの機能の中でも、エンタープライズレベルのコードアーキテクチャ解釈機能は、大規模モデルにおいてコードベースを迅速に解釈し、ビジネスロジックとエンジニアリングアーキテクチャ全体を明確化することを可能にします。プロジェクトを引き継ぐプログラマーは、コードを1行ずつ読み進める必要がなくなり、より迅速かつ明確な理解が可能になります。

エンタープライズレベルのコードレビュー機能は、従来のコードレビューの問題を解決します。既存の独自のコードと知識に基づく大規模モデルは、人間によるコードコンテンツのレビューを直接置き換えることができ、コード開発プロセス全体の効率と標準化を向上させます。

既存のプライベート コードと知識ベースに基づくエンタープライズ レベルの補助コードにより、AI プログラミングを企業独自のビジネス シナリオにより密接に適合させることができます。

企業の過去のコードや標準規格から迅速に学習し、生成されたコードを企業の要件により適合したものにします。現在、Wenxin QuickCodeは1万社以上の企業クライアントにサービスを提供しており、数百万人の中国人開発者のコ​​ーディング効率と研究開発全体の効率を20%向上させることに貢献しています。

要約すると、Baidu AI Cloud の今回のメジャー アップグレードは、企業の実際のニーズを中心に据え、基盤となるインフラストラクチャ、モデル機能とツール、AI アプリケーション テクノロジーのフル スタックをカバーしています。

なぜ彼らは「現地での作戦」に全力を注ぐことにこれほど明確に決意しているのでしょうか?

大規模モデルの応用が本格的な爆発的進歩を遂げたからです。

NIO、サムスン、中央政府および国有企業の半分を買収

以前のイベントで、百度副社長の謝光軍氏は、大規模モデルの応用の動向を3つの段階に分類しました。

最初の段階は ChatGPT のリリース直後で、大規模なモデルにアクセスしたい最初の一群の企業がコンピューティング能力を蓄積し、モデルのトレーニングを試み始め、業界全体でコンピューティング能力の需要が高まりました。

第2フェーズ(昨年後半から今年半ば)では、開発者が基盤となる大規模モデル上でネイティブAIアプリケーションの探索を開始し、生成AIを適用可能なシナリオを調査しました。このプロセスにおいて、大規模モデルの普及率は非常に高く、「過去10年間の生産現場や日常生活におけるAIの普及率よりもさらに高い」とされています。

今年半ばには、ようやくいくつかの大規模モデルアプリケーションが登場し、実際に実装されて価値を生み出すことができ、第3段階に入りました。

この三段階の区分は、千帆プラットフォームにおける文心シリーズモデルへのAPI呼び出しの増加傾向に基づいています。最新のデータによると、百度の文心大型モデルへの1日平均呼び出し数は7億回を超え、6ヶ月で10倍以上に増加しました。また、千帆プラットフォーム上の微調整済みモデルの数は3万を超えています。

さらに業界データを参照すると、2024年上半期の大型モデル分野の入札総額は約9億3,800万人民元で、2023年通年の大型モデル入札総額7億8,900万人民元という公表額を大幅に上回り、非常に大きな業界成長率を示しています。

大手大規模モデルベンダーの中で、百度は3つの「初」を達成しました。落札件数最多(17件)、業界カバレッジ最多(6業界)、そして落札総額最高額(9,297万元)です。中央政府および国有企業の半数以上が、百度スマートクラウドを活用してAIイノベーションアプリケーションを導入しています。

公表されている顧客の中には、人々の日常生活に大きな影響を与えるメーカーや企業が多数含まれています。

たとえば、Samsung Galaxy S24シリーズの携帯電話にはWenxin Big Modelが深く統合されており、「インスタント検索」、長い記事のワンクリック要約、デバイス上でのリアルタイム音声文字変換などのAI機能を提供できます。

「サークル&サーチ」は、Samsung Galaxy S24シリーズで初めて導入されたAI機能です。画面上の画像コンテンツを丸で囲んだり、描画したりするだけで、オンライン検索ができます。

AIスマートフォンは業界で認知されたトレンドであり、AIを人々の生活に真に統合するための重要な手段であることを理解することが重要です。大規模モデルがオペレーティングシステムにもたらす影響は、モバイルアプリケーションの第2次ブームにもつながるでしょう。IDCは、2024年までに中国市場の端末デバイスの70%以上にAI機能が搭載され、AI端末が市場の55%を占めると予測しています。

インテリジェントカー業界はAIと密接な関係があります。AIアシスタントは、インテリジェントドライビングコックピットにおける最も人気のある新トレンドの一つであり、自動車オーナーが大型モデルのトレンドを体験するための重要な媒体となっています。

たとえば、NIO はプロンプトワードエンジニアリングを通じて、Qianfan 大規模モデル プラットフォームと Wenxin 大規模モデルに基づいて NOMI GPT を構築しました。

よりユーザーフレンドリーで、よりスマートで、より多用途なAIアシスタント体験を提供します。現在、NOMIは約20万人の自動車オーナーとその家族にサービスを提供しています。

現在、Baidu AI Cloud は、政府/スマート シティ、交通、エネルギー、製造、自動車、金融、一般テクノロジー、教育の分野で大規模なモデル適用シナリオを検討しています。

それで質問です。

なぜ百度なのか?

Baidu はどのようにして複数の業界初を達成したのでしょうか?

まず、 AIは百度のDNAであり、その中核を成しています。過去10年間、百度は基盤技術の専門知識を蓄積し、自社開発モデル、モデル開発能力の対外展開、そして大規模モデルの実用化のための強固な基盤を築いてきました。

その結果、百度は基盤となるコンピューティングプラットフォームから上位レベルのアプリケーション展開に至るまで、フルスタックのAI機能を段階的に構築してきました。特に、大規模モデル化の潮流の到来に伴い、百度は迅速に大​​規模モデルプラットフォームと一連の業界特化型製品を立ち上げ、この潮流に対応し、大規模モデル製品の展開において中国でトップの地位を確立しました。

第二に、Baidu のAI 実装とアプリケーション構築における長年の経験は、大規模モデル機能の出力に関しても信頼できる基準を提供します。

最も直接的な例は、百度のビッグモデル開発経験を外部にアウトプットした、千帆ビッグモデルプラットフォームが提供する豊富なツールチェーンです。百度の謝光軍副社長は、百度の多くの事業がこのように運営されているように、企業ユーザーが千帆ビッグモデルプラットフォーム上で独自のデータフライホイールを形成できることを期待していると述べました。

Baiduは最新の開発において、大規模モデルのトレンドが様々な業界でAIへの熱狂を巻き起こしていることを認識していますが、これは従来のAIを完全に放棄することを意味するものではありません。多くの企業は依然として、大規模モデルと小規模モデル、そして従来のNLP/CVモデルの組み合わせを必要としています。そのため、BaiduはQianfan Large Model Platform 3.0により、この分野での機能をさらに強化しました。

3つ目に、異機種混合コンピューティングパワーシステムを構築するBaidu AI CloudのBaigeプラットフォームは、業界にさらに多様なコンピューティングパワーオプションを提供することができます。

特に大規模モデルの価格競争という状況において、「効率的」かつ「十分な」基盤コンピューティング能力により、Baidu はよりコスト効率の高いモデルコンピューティング能力サービスを外部に提供できるようになります。

上記の側面は、Baidu AI Cloud の「複数の初物」を構成します。

百度グループの執行副社長兼百度スマートクラウドビジネスグループ社長のシェン・ドウ氏は、クラウドインテリジェンスカンファレンスで、昨年はビッグデータモデルが技術変化から産業変化へと移行する極めて重要な年だったと語った。

ビッグモデルはすべてを再構築し、あらゆる企業に平等な成長機会を提供します。

人類史上、生産性の新たな飛躍が加速しています。

第一次産業革命における蒸気機関、第二次産業革命における発電所、そして第三次産業革命におけるコンピュータと同様に、クラウド コンピューティング インフラストラクチャは現在の第四次産業革命の「基盤となるインフラストラクチャ」です。

これまでとは異なり、インテリジェント時代においては、ハードウェアデバイスはインフラの重要な構成要素の一つに過ぎません。コンピューティングパワーを基盤として構築されるモデル、ツールチェーン、そしてアプリケーション開発ツールは、インテリジェント時代の「鉱物」を活用する上で、さらに重要になります。百度がクラウド・インテリジェンス・カンファレンスに最近参加したことは、この論理を具体的に示しています。

ビッグデータモデルの大規模応用の潮流に伴い、インテリジェント時代における基盤インフラの構築と発展も新たな加速期に入ります。

Baidu AI Cloudは主要プレーヤーとして万全の準備を整えている。