|
OpenAI の待望のインテリジェント エージェントが正式にリリースされました。 OpenAIの公式紹介: Operatorは、当社の最初のインテリジェントエージェントの一つです。これらのAIは、あなたに代わって自律的に作業を行うことができます。タスクを与えるだけで、自動的に実行します。 必要に応じて、買い物リストを提供すると、Operator が自動的に最適なものを購入します。 ご覧のとおり、オペレーターの手はキーボードから離れ、画面上のすべての操作はオペレーター自身によって実行されます。 レストランの予約にも使えます: ウルトラマンのライブストリームがちょうど終了した時、OpenAIのCEOであるブロックマン氏は熱心にこう発表した。 2025年はインテリジェントエージェントの年です。 そして今回、Operator は発表後すぐに正式にリリースされましたが、現時点では Pro ユーザー、つまり月額 200 ドル (約 1,458 人民元) のプレミアム メンバーシップのみが利用可能です。 ネットユーザーたちはライブ配信を見た後も大いに興奮し、「クレイジーな木曜日」と叫んだ。 しかし... ええ、Operatorは素晴らしいですが、オープンソースだったらもっと良くなるでしょう。DeepSeekとMeta、早く動いてください(doge)。 人間の支援なしにブラウザを使いこなしましょう。口で言うのは簡単です。Operator が実際にどれほど「独立」しているかを確認するために、公式デモを見てみましょう。 人間の支援なしに、ほぼすべての Web サイトで使用できます。 たとえば、Allrecipes でクラムフレンチのレシピを見つけて、すべての材料を Instacart のショッピングカートに入れたとします。 その操作ロジックは人間と同じで、どの画像を見てどのボタンをクリックするかを認識します。 API やプログラミング インターフェイスを使用する他のエージェントとは異なり、このエージェントは推論にテキストベースの思考プロセスを使用します。 メニューが決まったら、どのお店に行って食材を注文すればいいでしょうか? 次に人間が Gus を使用するなどの追加の指示を出し、オペレーターは対応する Web サイトにアクセスして注文を行います。 ログインや支払いなどの操作が発生すると、オペレーターはユーザーに操作を返します。 ユーザーテストでは、一部のブロガーは、Operator が Reddit でブロックされている場合、関連する投稿を見つけるために検索にキーワード「Reddit」が自動的に追加されることを発見しました。 ユーザーはカスタムコマンドを追加して、パーソナライズされたエクスペリエンスを実現することもできます。例えば、航空券を予約する際に、好みの航空会社を設定することができます。 Operator を使用すると、ユーザーはホームページですぐにアクセスできるようにヒントを保存できるため、ショッピング Web サイトでの補充などの繰り返しのタスクに最適です。 Operatorは、複数のWebページを開くのと同じように、複数のタスクを同時に実行することもできます。例えば、Etsyでパーソナライズされたエナメルマグカップを注文しながら、同時にHipcampでキャンプ場を予約するといったことが可能です。 Operator は、Computer-Using-Agent (CUA) と呼ばれるまったく新しいモデルを中核に使用します。 GPT-4o の視覚機能と高度な推論強化学習を組み合わせることで、CUA は GUI インタラクションを実行できます。 オペレーターはWebページインターフェースのコンテンツを閲覧し、マウスとキーボードを使用して許可されたすべての操作を実行できます。これにより、カスタムAPIの統合を必要とせずに自動操作が可能になります。 問題やエラーが発生した場合、オペレーターは推論機能を使用して自己修正を行います。また、行き詰まり、支援が必要な場合は、ユーザーに制御を返します。 CUA は、WebArena と WebVoyager の両方のベンチマークで最先端 (SOTA) の結果を達成しました。 現在、米国地域のProメンバーはoperator.chatgpt.comからOperatorを利用できます。Plus、Team、Enterpriseなどの有料会員、および他の地域のユーザーはもう少しお待ちいただく必要がありますが、OpenAIは将来的にこれらの機能をChatGPTに統合することを約束しています。 OpenAIが「レベル3」に突入2024 年 7 月、OpenAI は「AI から AGI への 5 段階のプロセス」をリリースしました。
OpenAI は当初の定義と計画において、まだレベル 1 であり、レベル 2 に近づいていると述べていました。 さて、オペレーターのリリースに伴い、ウルトラマンは次のことを発表します。 これがレベル 3 への旅の始まりです。 冒頭で述べたように、OpenAI が静かに重要な点を強調していたことは注目に値します。Operator はインテリジェント エージェントの「最初のバッチ」にすぎず、唯一のエージェントではないということです。 生放送中にウルトラマンも予告しました。 今後数週間から数か月の間に、さらに多くのエージェントを展開する予定です。 もう一つ今日の OpenAI のライブ ストリームの直前に、ちょっとした情報がありました。 Operator がリリースされる 2 時間前に、OpenAI は ChatGPT と API の高エラー率の問題を修正したとツイートしました。 彼はまたネットユーザーを騙した(doge)。 もうひとつの朗報は、Ultraman が ChatGPT の無料版でも o3-mini が使用可能になることを発表したことです。 |
OpenAIが突如Operatorをリリース!完全自律型ブラウザコントロール『ウルトラマン レベル3の時代』
関連するおすすめ記事
-
公式文書によれば、Xiaomi YU7の航続距離は820キロメートルであり、ポルシェSUVが再び注目を集めている。
-
高温超伝導における中国の躍進がネイチャー誌に掲載された。南方科技大学の薛其坤院士の成果である。
-
無料チケット | AI for Science 学術フォーラム開幕カウントダウン:上海交通大学、浙江大学、清華大学、OpenBayesなどの専門家が北京に集結
-
給料が払えない?かつてトップセールスだった新エネルギー車メーカーが答える。
-
マルチドメイン地球科学アプリケーション: 浙江大学のチームは、地理学、海洋学、地質学、大気の分野における時空間モデリングと予測を支援する GeoAI シリーズの手法を提案しました。
-
最高レベルのパフォーマンスと究極の清掃体験: Roborock A30 シリーズの床洗浄機が発売されました。価格は 1,999 元から。