618ZXW

王海峰: Wenxin Yiyan のユーザーベースは 4 億 3,000 万人に達しました。

「文心易眼のユーザーベースは4億3000万人に達した」。 11月12日、上海で開催された「応用はここにある」をテーマにした百度世界博覧会(Baidu World 2024)で、百度最高技術責任者(CTO)の王海鋒氏がこのデータを発表しました。ユーザー規模に加え、王海鋒氏は、テキストベースの画像検索強化、ノーコード製品「Miaoda」、文心クイックコードなど、文心ビッグデータモデルの最新技術と応用についても説明しました。

会議では、百度創業者の李彦宏氏が「文心ビッグモデル」の1日当たりの利用数が15億を超えたと発表したのに続き、王海鋒氏は「文心易眼」のユーザーベースが4億3000万人に達したと発表した。

昨年3月16日に「文心易言」がリリースされて以来、百度の文心ビッグモデルは継続的にアップグレードされ、知識強化、検索強化、インテリジェントエージェントなどの技術も絶えず進化している。

王海鋒氏は、検索強化の面では、百度が「理解・検索・生成」を連携させた検索強化技術を開発し、大規模モデル技術とアプリケーションのパフォーマンスを向上させたと説明した。また、様々なアプリケーションシナリオにおける画像生成のニーズに応えるため、百度は検索強化型のテキスト画像変換技術をさらに開発し、正確な画像と一般化された画像の両方を生成できるようになったと述べた。

では、大規模モデルではこれをどのように実現するのでしょうか?

まず、大規模なモデルに基づいて、システムがユーザーのニーズを分析・理解し、どのエンティティを強調表示するかなど、正確または一般化されたソリューションを自動的に計画します。次に、強調フェーズでは、強調が必要なエンティティについて、適切な参照画像が検索・選択されます。最後に、生成フェーズでは、独自に開発したマルチモーダルな制御可能な画像生成モデルが使用されます。一方では、ローカルアテンション計算により、エンティティの特徴を保持しながら一般性の高い画像生成を実現します。例えば、ニュートンの肖像画に基づいて絵本スタイルのニュートンを生成します。他方では、グローバルアテンション計算により、高精度な画像生成を実現します。例えば、生成された車の画像は元の画像と完全に同一です。実際のアプリケーションでは、この方法はユーザーがアップロードした参照画像もサポートしており、ユーザーの要求に応じて画像を生成します。

昨年10月、百度はインテリジェントエージェントのメカニズムをリリースし、システム2を開発しました。その中核となるのは、理解、計画、反省、そして進化を含む思考モデルです。システム2は信頼性の高い実行と自律的な進化が可能で、思考プロセスをある程度ホワイトボックス化することで、機械が人間のように思考・行動し、複雑なタスクを自律的に完了し、環境の中で継続的に学習・進化することを可能にします。

人間社会において、個人が持つ知識とスキルには限界があります。より複雑なタスクやプロジェクトを達成するには、チームワークが不可欠です。同様に、インテリジェントエージェントも複雑なタスクを完了するために、集中型、分散型、パイプライン型といったモデルを用いて、マルチエージェントによる協働作業を必要とします。マルチエージェント協働は、インテリジェントシステム全体のパフォーマンスを効果的に向上させ、複雑な問題を解決する能力を向上させることができます。

王海鋒氏は、コーディングシナリオにおけるマルチエージェントシステムの応用事例として、MiaodaとWenxin Quick Codeを紹介しました。Miaodaは集中型エージェントモデルを採用しており、コードエージェントは高度なシナリオ知識を通じて複雑なコード生成の品質と安定性を向上させ、ユーザーが必要とする機能を効率的に実装します。インテリジェントコードアシスタントWenxin Quick Codeはバージョン3.0にアップグレードされており、王海鋒氏はWenxin Quick Codeがシステム機能開発、コードテスト、バグ修正を完結する能力をさらに実証しました。開発プロセス全体を通して、複数のエージェントがパイプラインで連携することで、プログラマーの作業品質と効率が大幅に向上します。

大規模モデル、インテリジェントエージェント、その他の技術は急速に発展しています。これらの技術をより効率的に、そしてより低い参入障壁で産業界に適用するにはどうすればよいでしょうか?

業界の需要に応えるため、百度はERNIE 4.0 Turboなどの主力大型モデル、ERNIE Speedなどの軽量モデル、そして基本モデルに基づいて生成された一連の思考モデルとシナリオモデルを含むWenxin大型モデルマトリックスを構築し、さまざまなアプリケーションのニーズを満たしています。その背後には、Wenxin大型モデルとPaddlePaddleディープラーニングプラットフォームが共同で最適化され、継続的に革新され、モデルのパフォーマンス、トレーニング効率、推論パフォーマンスが向上し、Wenxin大型モデルの広範な応用を支えているという点があります。王海鋒氏はイベントで、PaddlePaddle Wenxinの開発者数は1,808万人に達し、43万社の企業にサービスを提供し、101万個のモデルを作成していることを明らかにしました。

人工知能(AI)技術の急速な発展に伴い、様々な産業への応用がますます深化しています。例えば、教育と科学普及の分野では、中国科学技術館と百度(バイドゥ)が戦略的協力協定を締結しました。両者はAI技術を活用し、科学教育に新たな活力を吹き込み、スマート科学技術施設の構築を推進します。中国科学技術館の郭哲館長と王海峰館長は、イベントで「科学技術館インテリジェントボディ」を発表し、科学普及サービスへのアクセスを向上させました。スポーツ分野では、大型模型などのAI技術が国家代表チームのトレーニングと準備を支援し、選手が金メダルや銀メダルを獲得するための技術的サポートを提供しています。インテリジェントダイビング支援トレーニングシステムは、クラウド・エッジ・デバイス統合技術を採用し、あらゆるダイビング動作を自動的に識別、追跡、収集、分析します。このシステムは、Wenxin 大規模モデルに基づいて、動きをリアルタイムで採点し、正確な定量分析を実施し、トレーニング プランを策定し、アスリートの身体データを科学的に評価して総合的に管理することもできます。

今日の科学技術の発展と広範な応用は、人材と切り離せない関係にあります。科学技術は主要な生産力であり、人材は主要な資源です。このイベントで、百度は人工知能(AI)人材育成に関する最新データを発表しました。同社は社会に貢献するAI専門家を592万人育成しました。

最後に、王海鋒氏は、文心大型モデルは今も継続的なトレーニング中であり、より強力な新バージョンが期待できると自信を持って明らかにした。