618ZXW

11の指標でGPT-4oを上回る!360の共同作業により、16社の大型モデルメーカーが集結し、最強の「六角形の戦士」チームを結成。

クレッシーがAofei Temple、QbitAIからレポート | WeChat公式アカウントQbitAI

最後に、国内で生産される大型モデルは、総合的な機能の点で GPT-4o と競合することができます。

12 の指標のテストでは、このモデルは11 の指標で GPT-4o を上回り、全体的なパフォーマンスは 10 パーセントポイント高くなりました

さらに、詩の鑑賞など中国の特色ある分野ではその優位性がさらに顕著になっており、知覇フォーラムの「最も難しい中国のベンチマーク」でも大きな進歩を遂げました

しかし、これは大手模型メーカー1社が単独で取り組んだものではなく、 16社のメーカーによる「共同チーム」によるものだった。

このチームは360が発起人で、自社の参加に加え、百度(バイドゥ)、火山エンジン、テンセント、アリババ、ファーウェイといったBAT(百度、アリババ、テンセント)などの大手企業、そして国内の大型モデル企業「五小虎」と呼ばれるZhipu AI、Lunar Dark Side、MiniMax、百川知能、01万武、そして5大垂直企業であるSenseTime、iFlytek、TAL教育グループ、Magic Cube、Mianbi Intelligenceなど、合計16社が参加している。(注:上記のリストは順不同)

現在、この「共同チーム」は、すべてのユーザーが無料で使用できるAI アシスタントという製品に組み込まれています。

10以上の大型モデルがあなたのために働きます

AIアシスタントには16メーカーの大型モデルが搭載されており、ユーザーは同じプラットフォーム上で直接対話し、好みのモデルを選択できます

さらに、プロセス中にいつでもモデルを切り替えることができ、システムは前のコンテキストを記憶しているため、後続のモデルが対話を継続できます。

たとえば、次のダイアログ ウィンドウでは、Zhipu 9.11 と 9.8 のどちらが大きいかを尋ね、次にモデルを Xinghuo に切り替えて、どのように比較したかを直接尋ねました。

この会話から、次に登場した星火は、「どのように比較するか」という質問が小数点以下の桁数の比較を指していることを正確に理解していたことがわかります。

もちろん、同じ問題に対して、他社のモデルを直接持ち出して、実際に比較することもできます。

モデルを比較する際に、より多くの情報や回答を確認することもできます。これにより、回答がより詳細になるだけでなく、相互検証も可能になります。

例えば、テレビドラマ「雍正朝」に登場する二人の登場人物の関係について疑問が生じました。この疑問は最初にZhipu氏に投げかけられました。

次に、より詳しい情報を得るために、文鑫易燕にも回答を依頼しました。結果として、Zhipuの回答は正しかったものの、文鑫易燕はさらに詳細な補足情報を提供しました。

さらに重要なのは、360 AI アシスタントは、選択に困っている人やどのモデルがより適しているかわからない人にとって非常に使いやすいということです。

対話モデルとして「AI アシスタント」エンティティを選択すると、システムは対話内容に基づいて意図を判断し、タスクの種類に応じて最適なモデルを自動的に一致させます

たとえば、ライティングタスクを完了する場合、AIアシスタントはコピーライティングが得意なDoubaoを割り当てます。

プログラミング上の問題に遭遇すると、強力なコーディング機能を備えた DeepSeek が呼び出されます。

主に論理的推論を必要とする問題は、Zhipu で処理した方がよいかもしれません。

もちろん、インターフェース上に表示されるタスクのカテゴリーは比較的大まかなものです。実際の操作では、AIアシスタントがタスクをさらに細かいカテゴリーに分類します。

なお、AIアシスタントはモデルを選択する際にまずオンライン検索を実施します。

したがって、AI アシスタントを使用するもう 1 つの利点は、モデルの知識ベースの更新時間を気にすることなく、最新の情報を入手できることです。

いくつかの一般的なタスクについては、AI アシスタント プラットフォームは、これらの機能をより適切に実行できる専用のアシスタントも提供します。

AI アシスタントは、Web ページで使用されるほかに、デスクトップと 360 セキュリティ ブラウザという 2 つの主要なエントリ ポイントがあります

たとえば、360 Security Browser では、AI Assistant プラグインをインストールすると、Web ページを閲覧するときに右下隅にフローティング ボールが表示されます。

1 回のクリックで右側のサイドバーに AI アシスタントを呼び出すことができ、書き込み中に同じウィンドウ内で AI アシスタントとすばやく会話することができます。

さらに、フローティングボールの上にマウスを移動すると、その上に新しいボタンが表示されます。このボタンをクリックすると、現在閲覧しているページの要約をワンクリックで表示できます。

ページの詳細についてAIアシスタントに質問することもできます。

英語コンテンツの要約もサポートしています。

さらに、ページ上の特定の単語やフレーズを選択すると、AI アシスタント ツールバーが表示され、選択した部分を翻訳または説明したり、オンラインで関連情報を検索したりすることができます。

デスクトップ版は 360 Security Guard を採用しており、機能はブラウザに似ていますが、単語の強調表示の範囲が Web ページからシステム全体に拡張されています。

では、AIアシスタントの裏ではどのような技術が使われているのでしょうか?

独自の「専門家コラボレーション」アーキテクチャ

実は、需要に基づいて大規模モデルをスケジュールするこの方法は、専門家コラボレーションアーキテクチャである 360 – CoE (Collaboration-of-Experts)によって導入された新しいテクノロジーでもあります。

国内で開発されたモデルの多くは、個々の指標では OpenAI に匹敵、あるいは上回っていることが分かっていますが、総合的な強さとなると、その差は明らかです。

360 のアプローチは、この「一匹狼」モデルを変更し、大規模モデルの「エキスパート クラスター」を構築して、ハイブリッドな大規模モデルを形成し、それぞれの長所を活用して「共同チーム」方式で GPT-4o と戦うことです。

その結果、国産大型モデル16種で構成された360CoEアーキテクチャに基づくハイブリッド大型モデルは、12の指標のテストで総合スコア80.49を達成し、GPT-4oのスコア69.22を上回りました。

さらに、コードを除いて、他の 11 のメトリックはすべて GPT-4o よりも優れています。

特に、「白痴の酒場」や詩の鑑賞など、中国語特有の問題では、CoE の優位性がさらに顕著になります。

MoE (Mixture-of-Experts) アーキテクチャと比較すると、360 の CoE モデルは速度、インテリジェンス、コストの面で大きな利点があります。

CoE は、意図認識とタスク スケジューリングを通じて推論リソースの割り当てを最適化し、効率を向上してコストを削減し、推論コストを 90% 削減します

CoE アーキテクチャでモデルを最も効率的にスケジュールするには、少なくとも 2 つの作業側面が不可欠です。

まず、これらのモデルの能力を包括的に評価する必要があります。そうすることで初めて、各モデルが優れている領域を理解し、どのようなタスクを割り当てるべきかを把握することができます。

この目的のために、360 は 12 の分野にわたる専門家データベースのモデルのパフォーマンスに関する包括的なテストを実施し、モデルの独自の機能を特定しました。

GPT-4oを除き、他のモデル名は非公開となっております。

もう 1 つの側面は、ユーザーの意図の解釈です。タスク要件を理解することは、割り当てモデルにとって不可欠な基盤であることは明らかです。

360 は、過去 10 年間の検索エンジン開発で蓄積された技術とデータに基づき、1 億以上の意図カテゴリーを認識できる特殊なモデルをトレーニングしました。

AIをより包括的に

技術的な専門知識以外にも、360 社がどのようにして 15 社の大手モデルメーカーを「傘下」に引き入れる契約をまとめ上げたのか、不思議に思わざるを得ません。

360の創業者兼会長である周紅一氏は、多くのメーカーが協力を希望する理由は、大型モデルへの投資額が莫大であり、人々が使用することで初めてコストを回収でき、製品を継続的に改善できるからだと説明した

360 には大規模なユーザー ベースがあり、デスクトップとブラウザーという 2 つの主力シナリオを展開できるため、これらのモデルに膨大なユーザー グループを呼び込むことができます。

プラグインと比較すると、これら 2 つのエントリ ポイントにより、ユーザーは大規模モデルの機能に非常に近づくことができます。現在、大規模モデルに対する最大のニーズは、まさにシーンとユーザーに近づき、ユーザーが使用できるようにすることです。

さらに、統合AIアシスタントは、個々の大規模モデルの欠点を回避し、それぞれの長所を組み合わせることでGPT-4oを上回ることができます。これにより、メーカーはユーザーに体験・利用してもらう機会を得ることができ、今後さらに多くのシナリオがリリースされる予定です。

360 AI Assistant のモデルは、AGI の登場前にモデルのパフォーマンスを向上させるための優れたソリューションであり、AI の普及率の向上にも役立つと言えます。

最近、国内の大手機種メーカーはよりオープンになっていくことで合意し、より安価なトークンAPIを提供しています。

したがって、360 がデスクトップとブラウザをエントリー ポイントとして開放するのは、「世界中から人材を集める」ためだけではなく、オープン化に向かう​​一般的な傾向に従うためでもある。

より高い視点から見ると、360 はAI をより多くの人々が利用できるようにしたいと考えています

周紅一氏は、 AIは人間を排除するのではなく、AIの使い方を知らない人々を排除すると考えている。一方、使い方を知っている人にとっては、AIは強力なツールとなるだろう。

しかし、AI 自体は、見下すようなものではなく、学習したい人なら誰でも利用できるようにする必要があります。

360 が意味するのは、すべての人に AI を届けることです。つまり、誰もが AI によってもたらされる機能を享受し、AI 時代に取り残されることがないようにすることです。

AIアシスタントポータル: https://bot.360.com