大型モデル間の格差は今後も拡大するでしょう! ロビン・リーの最新の社内スピーチが漏洩し、業界で白熱した議論を巻き起こしている。 結局のところ、さまざまな大規模モデルがリーダーボードやテストセットを席巻し、複数の領域で GPT-4o よりも高いスコアを達成しているため、次の GPT-4o または次の OpenAI が誕生しようとしているという幻想を抱くのは簡単です。 なぜそう言うのでしょうか?ロビン・リー氏はさらに、大規模モデルの限界は非常に高く、理想的な状況には程遠いと説明しました。そのため、モデルは継続的かつ迅速に反復、更新、アップグレードしていく必要があります。 これには、ユーザーのニーズを継続的に満たし、効率性を高めながらコストを削減するための長年、あるいは数十年にわたる継続的な努力が必要です。 さらに、オープンソース モデルは非効率であり、計算能力の問題を解決できない一方で、インテリジェント エージェントが大規模モデルの最も重要な開発方向であると述べました。 百度は常に大規模アプリケーションの先駆者であり、そのリーダーであるロビン・リー氏の発言は間違いなく業界に実践的な参考資料を提供している。 彼が実際に何を言ったか見てみましょう。 Li Yanhong の内なる会話から、このモデルに関する 3 つの大きな誤解が明らかになりました。社内討論において、ロビン・リーはよくある誤解に直接言及する3つの点を提起しました。「大規模モデル間の格差は縮まっているのか?大規模モデル技術は限界に達したのか?なぜ商用モデルの方がコスト効率が高いのか?」 まず、大型モデル間のギャップは小さくなるどころか、大きくなっています。 李延宏氏は、大規模モデル間の能力差が縮まったという見解を即座に否定し、モデル間の差は依然として大きく、今後さらに拡大するだろうと主張した。李氏は、新しくリリースされたモデルはテストセットで良好なパフォーマンスを示したものの、それがGPT-4oなどの最先端モデルとの差が縮まったことを証明するものではないと指摘した。 彼は、多くのモデルがリリースされると、ランキングやテスト問題の推測、解答テクニックなどから、それらの能力は非常に近いように見えるかもしれないと説明した。「しかし、実際に適用してみると、それらの実力には依然として大きな差があるのです。」 一方、モデル間の違いは多次元的です。モデルの能力評価には、理解、生成、論理的推論といった複数の側面に加え、それに伴うコストや推論速度も考慮する必要があります。さらに、テストセットへの過剰適合は、モデルの能力に関する誤解を招く可能性があります。 大規模モデルが実用段階に入った今、真の評価基準は、モデルがユーザーのニーズを満たし、実用化において価値を生み出せるかどうかにあると彼は考えている。そのため、百度での実際の運用においては、技術者がランキング競争に参加することを許可していない。 一方で、このモデルの限界は非常に高く、現在達成できる成果は望ましい結果には程遠いため、モデルは継続的な反復と更新が必要です。数年、あるいは10年以上にわたる継続的な投資によってのみ、このモデルはユーザーのニーズ、シナリオ要件、そして効率性の向上やコスト削減の要求を満たすことができます。これは競争力を維持するための鍵でもあります。 したがって、ロビン・リーは、12ヶ月先を行くか18ヶ月遅れるかはそれほど重要ではないと考えています。たとえ競合他社より常に6ヶ月先を行くことを保証できたとしても、それはすでに勝利なのです。 第二に、オープンソース モデルでは商用アプリケーションの効率の問題を解決できません。 ロビン・リー氏は講演の中で、オープンソースモデルはユーザー自身による導入と保守を必要とするため、GPUの利用率が低く、推論コストを効果的に分担できないことを強調しました。対照的に、クローズドソースモデルは、ユーザーがリソースを共有し、開発コストを償却できるため、より高い効率性と効果性を実現します。 現在、Wenxin の大型モデル 3.5 および 4.0 の GPU 使用率は 90% 以上に達しています。 前述の通り、モデルの評価には複数の側面が関係します。リーダーボードに掲載されている様々な機能を見るだけでなく、その有効性と効率性も考慮する必要があります。大規模モデルが急速に商用アプリケーションに導入されるにつれ、オープンソースモデルは高効率性と低コストの追求においてもはや優位性を発揮しなくなっています。 Robin Li 氏は、大規模モデルの時代においては、計算能力の効率的な使用がモデルの成否の鍵であり、オープンソース モデルではこの問題を解決できないと明言しました。 最後に、インテリジェント エージェントは大規模モデルにとって最も重要な開発方向を表しており、参入障壁が低いため、アプリケーションの変換がより直接的かつ効率的になります。 大規模モデルの開発における主な段階は何でしょうか?社内講演で、ロビン・リーは明確な答えを示しました。 最初の段階は、人間の操作を支援するコパイロット段階です。次の段階は、ツールを自律的に使用し、独自に進化する能力を持つエージェント段階です。そして最後に、さまざまなタスクを独立して完了できる AI ワーカー段階です。 中でも、大規模モデルにおける最も重要な発展方向であるインテリジェントエージェントは、多くの注目を集めているマルチモーダルモデルに比べると、まだ業界のコンセンサスが得られていません。しかしながら、百度の製品、例えばWenxin AgentBuilderプラットフォームなどは、既にインテリジェントエージェントの可能性を認識し始めています。 参入障壁が低いため、モデルからアプリケーションへの変換が簡単になり、Baidu プラットフォーム上に多数の新しいインテリジェント エージェントが作成されます。 ロビン・リー氏は、百度のユーザーベースとユーザー需要を活用することで、インテリジェントエージェントが市場ニーズをより良く満たし、さらなる発展を促進できると強調した。 Baidu の AI エージェント実践はより高度な段階に入った。要約すると、ロビン・リー氏の考察の最初の2点は現在に関するものですが、インテリジェントエージェントは未来を象徴しています。そして、これらすべての背景にあるのは、大規模モデルの開発がより複雑な段階に入っているという事実と密接に関係しています。 今日、基本モデルの更新ペースが鈍化し、大規模モデルの適用が業界全体でますます普及するにつれ、企業はより複雑な市場環境と技術的課題に直面しています。市場の多様なニーズを満たすには、単純な技術の反復だけではもはや不十分です。 大規模モデルに対する人々の期待と見方も変化しました。モデルのパラメータ数やリーダーボードのスコアはもはやモデルの能力を示す主要な指標ではなく、モデルがオープンソースであるかどうかも重要ではなくなりました。 AIに対する産業界の需要は、単なる技術追求の域を超え、現実世界の課題解決こそが大規模モデルを評価する唯一の基準となっています。このプロセスにおいては、推論コストや計算能力、ビジネスデータの処理効率など、無視できない多くの問題や課題が存在します。 長年この業界に投資してきた百度は、当然ながらこの問題に直面して、中国国内の多くの大規模モデルに開発の参考資料を提供している。 答えはインテリジェントエージェントです。 そのため、今回の李延紅氏による社内対談は、業界の洞察だけでなく、百度のインテリジェントエージェント実践の強力な検証とデモンストレーションでもありました。 これに先立ち、ロビン・リーはいくつかのスピーチで、インテリジェントエージェントがAI時代の将来のトレンドを代表するものであると強調していた。 インテリジェントエージェントは、幅広く普遍的に適用可能なモデルであるため、参入障壁が低いだけでなく、プログラミングスキルを必要とせず、ユーザーが容易に強力なアプリケーションを開発できます。ロビン・リー氏は、インテリジェントエージェントを「AI時代のウェブサイト」に鮮やかに例え、数百万人のユーザーを抱える巨大なエコシステムの到来を予感させました。この幅広い応用可能性により、インテリジェントエージェントは様々な業界にとって「スーパーアプリ」となり、AI技術の普及と応用を牽引します。 それに応じて、Baidu はインテリジェントエージェントの分野で大きな進歩を遂げました。 百度はAgentBuilderプラットフォームを通じて、20万人の開発者と6万3000社の企業を誘致し、2023年7月には文心ビッグモデル4.0を無償リリースしました。この取り組みにより、開発者はエージェント構築時に適切なモデルバージョンを柔軟に選択できるようになり、開発のハードルを大幅に下げました。 さらに、BaiduのAIエージェントは短期間で大規模モデルへの応用において高いポテンシャルを示しました。Baiduの2024年第2四半期財務報告によると、BaiduエコシステムにおけるAIエージェントの配信量は急速に増加しており、7月には1日平均800万件を超え、5月の2倍以上に増加しました。 人気のインテリジェントエージェントには、コンテンツ作成、性格診断、スケジュール計画などがあり、教育、法律、B2Bなど複数の業界をカバーしています。Baiduのインテリジェントエージェントエコシステムは16,000社の加盟店を魅了し、ユーザー、開発者、サービスプロバイダーの3者にとってWin-Winの関係を築いています。 ロビン・リー氏は、インテリジェントエージェントの開発は技術革新だけでなく、ユーザーニーズとの緊密な連携も必要だと強調しました。インテリジェントエージェントに対するユーザーのニーズが高まり続けるにつれて、エージェントは急速に進化していくことができます。インテリジェントエージェントエコシステムの継続的な拡大を通じてのみ、AI技術の様々な分野への深い応用を促進することができるのです。 大規模モデルの応用が増加する中、Baidu のインテリジェント エージェントの実践は、間違いなく業界にとって重要な参考資料とインスピレーションを提供します。 大型模型ブームは再編期を迎えている。今年ますます顕著になっているのは、大型模型技術の継続的な発展と応用の深化に伴い、業界が新たな段階に入りつつあることです。この段階は、大型模型関連企業間の競争環境がほぼ確立し、大型模型の自立的かつ持続的な研究開発能力を持つ企業がトップ企業に集中し始めていることを特徴としています。 同時に、大規模モデルの応用・実装によるエコシステム構築の段階に入りました。 大規模モデルの将来に楽観的な起業家はますます増えており、独自の大規模モデルを開発または構築するかどうかで悩むのではなく、既存の大規模モデルを使用して実際の問題点や問題を解決する方法に注目しています。 このプロセスにおいて、AIアプリケーションの実装形態として最小の形態であるインテリジェントエージェントは、大きな可能性を示してきました。導入障壁が低く軽量であるため、迅速な導入と様々な業界への展開が可能で、効率性とコストの両方の要件を満たします。基盤となるモデルが継続的に改善されるにつれて、インテリジェントエージェントアプリケーションはさらにシンプルになり、より広く普及していく可能性があります。 これは、ロビン・リー氏がインテリジェントエージェントに対して楽観的な理由の核心でもあります。 ロビン・リー氏の講演から、百度の戦略重点が移行しつつあることが分かります。基本モデルの構築段階は過ぎ去り、今やより重要なのは、インテリジェントエージェントを通じて豊かで多様なアプリケーションエコシステムを構築し、百度の全体モデルとコアコンピタンスを守る堀となることです。 これは、百度がアプリケーションエコシステムにおけるインテリジェントエージェントの価値と重要性をより重視し、インテリジェントエージェントプラットフォームとツールを継続的に改善することで、より多くの開発者と企業の参加を促し、繁栄するAIアプリケーションエコシステムを共同で構築することを意味します。 将来的には、インテリジェントエージェントは、コンテンツ作成やスケジュール計画などの基本的な機能に限定されず、医療、金融、法律サービスなどのより専門的な分野に拡大し、ユーザーにパーソナライズされた効率的なソリューションを提供します。 このビジョンを実現するには、企業は技術革新と反復に継続的にリソースを投資し、アルゴリズムを常に最適化し、ユーザー エクスペリエンスを向上させる必要があります。 もちろん、このプロセスでは、データのプライバシーとセキュリティ、インテリジェントエージェントの管理と保守といった重要な課題にも直面するでしょう。しかし、どんな技術応用も、より深い領域に進むにつれて、様々な課題に直面することになります。 インテリジェントエージェントのエコシステムが成長を続ける中、Baidu はよりインテリジェントで効率的な未来に向けて業界をリードし、さまざまな業界に新たな機会と課題をもたらしています。 |
Robin Li 氏は、大規模モデルに関する一般的な誤解を解き明かします。オープンソースでは効率の問題を解決できず、大規模モデル間のギャップは広がっています。
関連するおすすめ記事
-
オンラインチュートリアル | 3つの音声クローンモデルの実世界レビュー:GPT-SoVITSは「十一娘娘」の特徴を正確に捉える
-
インテルの新型Xeon W:60個の高性能コアがAIパフォーマンスを26%向上
-
中国車の売れ行きが好調です!BYDは1日1万台を販売、Li Autoの月間販売台数は5万台に戻り、NIOのような高級車でも2万台に達しています。
-
村とAIをつなぐ鍵はこれだ! 34の地域にハイパーヒューマノイドAIエージェントが展開され、その背後にある技術が明らかになった。
-
「私たちには堀がない」:オープンソースAIの急速なイノベーション
-
Microsoft の「事故」により Linux が混乱に巻き込まれる: アップデート後、Linux が開かなくなる。