|
そうです、OpenAI のインテリジェントエージェントの時代が本当に到来するのです! 有名な「情報提供者」Bald Guy によると、OpenAI は ChatGPT デスクトップ アプリケーションの Mac バージョンでエージェントを有効/無効にするオプションを隠しているとのことです。 スクリーンショットから判断すると、それは確かに長い間噂されていたコードネーム「オペレーター」の人物です。 さらに、このリークは、Apple に関するニュースを定期的にフォローしているブロガーの@M1によって裏付けられました。 Operator は現在クローズド ベータ テスト中ですが、ChatGPT デスクトップ アプリケーションの Mac バージョンはまもなくリリースされる予定です... 紹介によれば、Operator はユーザーの PC を乗っ取り、人間に代わって一連の操作 (アプリケーションのコーディングや開発、食べ物の注文、旅行の計画の作成など) を自律的に直接実行できるとのこと。 同時に、OpenAI エージェントと他の競合エージェント (Anthropic エージェントや Google エージェントなど)、および人間の競合エージェントとのベンチマーク比較も公開されました。 重要な点として、自動化されたタスクを実行する知能エージェントのレベルを評価するいくつかのベンチマーク テストでは、OpenAI が Claude エージェントよりも優れたパフォーマンスを発揮しました。 ネットユーザーたちは、リリースが非常に近いようで、次の ChatGPT の瞬間になるかもしれないと興奮を表明しました。 一方、Windows ユーザーは猛烈に反発し、「これを Mac だけに限定しないでください! お願いですから、これを Mac だけに限定しないでください! お願いですから、これを Mac だけに限定しないでください!」と訴えました (OpenAI さん、聞いていますか?) 複数のベンチマークスコアがクロードエージェントを上回るBald Guy の別のツイートでは、OpenAI のインテリジェント エージェントと他の競合製品の詳細な比較が見られました。 関連データは OpenAI の Web サイトから取得したもので、具体的には画像内で黄色で強調表示されている部分です。 個別に見てみると、マルチモーダルエージェント向けに特別に設計されたベンチマークである OSWorld では、OpenAI CUA (おそらく Operator を駆動する AI モデル) が 38.1% のスコアを獲得し、Anthropic のコンピューター使用機能を上回りましたが、それでも人間が操作する CUA の半分以下のレベルでした。 同様の状況は、WebArena (CMU がリリースした Web ベースのベンチマーク) でも発生しました。 しかし、WebVoyager(Tencent AI Labがリリースしたマルチモーダルネットワークエージェントベンチマーク)では、状況はわずかに逆転しました。OpenAI CUAは87%という好スコアを達成し、Anthropicを常にリードしただけでなく、人間をわずかに上回りました(85.3%)。 特定のタスクの成功率から判断すると、支援オペレーターは完全な自律操作よりも優れたパフォーマンスを発揮しますが、視覚機能を備えた GPT-4o と比較できない場合もあります。 これに基づいて、一部のネットユーザーは、Operator が GPT-4o より劣っているかどうかを尋ね、他の親切なネットユーザーは 2 つの違いを指摘しました。 1 つは自分で操作すること、もう 1 つは操作方法を教えることです。 また、両者のセキュリティ評価は以下のとおりです。GPT-4oは違法な宣伝や過激派活動の議論の禁止に100%準拠していますが、Operatorは脱獄、違法行為、禁止された金融活動の禁止に100%準拠していません。 なお、上記のベンチマークスコアはあくまでも仮のものであり、その正確性は保証できないことをご承知おきください。(免責事項) 2025年:OpenAIはエージェント開発に注力する実際、オペレーター AI については、昨年 11 月にすでにリークされていました。 当時、ブルームバーグは、OpenAIがユーザーのタスクを自動化するためにこれを翌年の1月にリリースすると主張していた。 そして今、これは以前のニュースをさらに裏付けるものとなった。 昨年末にはすでに、OpenAI の CEO である Altman 氏は、新年の抱負のトップにエージェントを明確に挙げていました。 OpenAIは目標を設定した後、年初からすぐに行動を開始しました。 先週、OpenAI は ChatGPT に「タスク」という新しい機能をリリースし、AI がさまざまなタスクを実行できるようになりました。 1 回限りのリマインダーでも、定期的なアクションでも、必要な内容と必要なタイミングを ChatGPT に伝えると、自動的に処理されます。 全体的には、エージェントの初期段階のように、スケジュールのリマインダーに重点を置いているようです。 これに基づいて、Operator がより多くの強力な機能を備えるようになると推測するのは妥当です。 国内外のテクノロジー企業によるエージェントへの新たな取り組みから判断すると、今年は間違いなくエージェントにとって良い年になるでしょう。 市場調査会社Markets and Marketsによれば、AIエージェント市場は2030年までに471億ドルに達すると予想されています。 このような魅力と、成熟した大規模モデル技術が組み合わさって、エージェントが 2025 年にヒットすることは言うまでもありません。 今年の CES でも、Nvidia の CEO である Jensen Huang 氏は Agent を高く評価しました。 将来的には、同社の IT 部門がエージェント人事部門になります (社内の多数のエージェントを向上し、さまざまな部門に新しいサポートを提供するため)。 これらの発言を受けて、開発者も AI エージェント技術の理解を 2025 年の学習課題に組み入れました。 そうですね、企業であれ個人であれ、今では誰もがエージェントと関わることになります (doge)。 |
OpenAIのインテリジェントエージェントに関する新たな手がかりが明らかになりました!ネットユーザーの皆様、新たなChatGPTの時代が到来です!
関連するおすすめ記事
-
李菲菲の最新インタビュー:AIの10年、彼女が見る世界
-
Tianwenベースのビッグデータモデルがさらにアップグレードされ、ビデオを「見て」理解するだけでなく、小さなターゲットを素早く認識し、シーンの関係性を理解することもできるようになった。
-
o1の思考プロセス全体はOpenAIの最大のタブーです!質問が多すぎるとアカウントが停止されます。
-
SmartとDeepRoute.comは、スマート運転技術の世界的な拡大を加速するために戦略的提携を締結しました。
-
SearchGPT のオープンソース バージョンがリリースされました。3090 の画像 2 枚だけで問題を再現でき、Perplexity の有料バージョンを上回っています。
-
GPT-4o の新しいバージョンが突然リリースされました。9.11 と 9.9 のどちらが大きく、より強力で、より安価であるかという問題がスムーズに解決されます。