618ZXW

スケーリングの法則がボトルネックに遭遇しており、OpenAI は「Operators」に賭けていると報じられています。

Anthropic に続いて、OpenAI が人間とコンピューターのインタラクションを引き継ぐことになるのでしょうか?

ちょうど今、ブルームバーグは、OpenAIが来年1月にユーザーのタスクを自動化する Operator と呼ばれるエージェントをリリースすると報じました。

レシピにも精通しています。コンピューター上で簡単な指示を与えるだけで、エージェントが自動的にコーディングやアプリケーションの開発、食べ物の注文、旅行ガイドの作成などを手伝ってくれます。

まあ、これは彼らが古くからのライバルである Anthropic と衝突しようとしていることを意味することは誰もが一目で分かります。

これは、Anthropic のコンピュータ使用 API と競合します (Anthropic は以前、人間のコンピュータを乗っ取ると主張するコンピュータ使用機能をリリースしました)。

実際、Reddit での最近の Q&A セッションで、CEO の Altman 氏は自信を持って次のように述べています。

エージェントは次なる大きな進歩となるでしょう。

一方、OpenAIの最高製品責任者であるケビン・ウェイル氏は、ChatGPTが自律的にタスクを実行できるようにすることが来年の主要な焦点になるだろうとさらに述べた。

しかし、「はるかに先を行く」Anthropicとは別に、OpenAIのライバルであるGoogleも、12月に独自のAIエージェントバージョンをリリースすることをすでに発表している。

Baidu Zhipuなどの国内モデルメーカーも同様のインテリジェントエージェントやソリューションを発表しており、HonorやXiaomiなどの携帯電話メーカーも独自のAIオペレーティングシステムをリリースしている。

これは OpenAI にプレッシャーを与えます。

急いでも来年1月に発売できるかもしれないが、一部のネットユーザーからは「まだ遅すぎる」と厳しく批判されている。

ネットユーザー:1月は遅すぎる。

ブルームバーグによると、OpenAIは来年1月に「Operator」というコードネームのエージェントをリリースする予定だという。

その機能は、10月にAnthropic社がリリースしたコンピューター操作に似ています。人間の手を解放し、ユーザーに代わってコンピューターを操作すると主張しています。

例えば、旅行の旅程を作成するように求められた場合、コマンドを発行すると、エージェントは自動的に Google を開いて場所や天気を検索し、ユーザーのスケジュールに基づいて実用的なプランを提供できます。

さらに、OpenAI内部の情報筋によると、水曜日の従業員会議でリーダーが次のように発表した。

この機能は早期プレビュー(元々は Web ブラウザでタスクを実行するために設計)としてリリースされ、当初はAPI 経由で開発者のみが利用できるようになります。

リークによると、OpenAI は実際に多くのエージェント プロジェクトを同時に進めており、Operator が最も成功に近づいている可能性があります。

OpenAIは記事執筆時点では上記の噂に対して反応を示していない。

しかし、OpenAI の開発を追ってきたハゲ男は、Operator の痕跡を見つけることができました。

しかし、たとえこのニュースが真実だとしても、OpenAI の動きはまだ少し遅すぎる。

結局、周りを見渡すと、競争相手は全員彼らより先を進んでいるようです

言うまでもなく、その最大のライバルである Anthropic は 10 月に関連機能をリリースし、AI コミュニティを驚かせました。

常にGoogleと密かに競合しているGoogleも、12月に「Jarvis」というコードネームのエージェントをリリースする可能性が高い。双方のタイムラインから判断すると、このラウンドではGoogleが勝利する可能性がある。

言うまでもなく、現在 Anthropic との関係がぎくしゃくしている Microsoft は、Anthropic より 1 日早く 10 個のエージェントをリリースしました。

それらをすべて脇に置いておくと、中国でもかなりの数のプレーヤーがエージェント分野で動き始めています。

たとえば、今年 9 月に開催された Baidu Cloud Intelligence Conference で、Baidu はエージェントが携帯電話を操作するシナリオを実演しました。

エージェントは、ほんの少し話すだけで、旅程を計画したり、さまざまなアプリ間を自動的に切り替えたりすることができます。

国慶節の連休中に山西省へ3日間の旅行を計画したいと思っています。映画『黒の神話:悟空』に登場する山西省の名場面も考慮に入れたいと思っています。また、高評価のレビューと500元以下の予算で、質が高くコストパフォーマンスの良いホテルに宿泊したいと思っています。さらに、自家用車でのルートも計画したいと思っています。

さらに、Anthropic に続いて、Zhipu は AI が人間のように携帯電話を使用できるようにする AutoGLM もリリースしました。要求を出すために入力する必要がある Claude とは異なり、AutoGLM では話すだけで多くの操作を実行できます。

AI PCやAIスマートフォンの分野でも、主要プレーヤーがこの新しいパラダイムに注目しています。

ファーウェイは10月23日、Cエンドユーザー向けの「人間のようなアシスタント」と位置付けるHonor MagicOS 9.0をリリースしました。大規模なモデルベースを介してアプリを連携させ、システムレベルのAI操作を実現するAIエージェントステージを正式に開始しました。

さらに、Honorは昨日、MagicOS 9.0を使用した最初の一連の製品の公開テストを開始したと正式に発表しました。対象はHonor Magic Vs3、V2シリーズ、Magic6シリーズ、Magic5シリーズです。

さらに、Xiaomiは、大規模なAIモデルに基づいて再構築されたオペレーティングシステムであるSurge OS 2.0システムもリリースし、デバイスをインテリジェントな「パーソナルアシスタント」に変えました。

...

上記のことからわかるように、常にリーダーであった OpenAI は、エージェントの面では遅れをとり始めています。

2025年はエージェントのもの

しかし、これはまた、来年はエージェントが重要な戦場になる可能性が高いことを示しています。

結局のところ、大規模モデルのスケーリング則の持続可能性の欠如は、議論の的となっています。

報告によると、OpenAI、Google、Anthropic はいずれも、より大規模で強力なモデル製品の立ち上げにおいてボトルネックに直面しているという。

具体的には、OpenAIの次世代フラッグシップモデル(コードネーム「Orion」)は、期待を下回るパフォーマンスを示していると報告されています。GPT-4と比較した改善度は、GPT-3と比較したGPT-4の改善度よりも低く、収穫逓減の段階に入ったことを示しています。

これは、ウルトラマンが新しいモデルに GPT-5 という名前をつけないかもしれないという発言を裏付けるものでもある。

なお、GoogleのGemini 2は近々リリースされる予定となっているものの、その性能向上はDeepMind創業者の期待に応えられていないとも報じられています。

一方、Claude 3.5 Opusの大型バージョンを求めるネットユーザーからの根強い要望に応えて、Anthropicは公式ウェブサイトから関連の説明をひっそりと削除した。

そして、エージェントは明らかにすべての人にとって新たな方向性となりました。

この黄金時代はネットユーザーが望んでいたものなのかもしれない。 2025年はエージェントのものだ!