618ZXW

ChatGPTは今朝早くにメジャーアップデートを受けました! — 私の理想のAGIインターフェース

データホエール

データホエールの共有

出典:Machine Heart、編集者:Datawhale

私の理想の AGI インターフェースは空白のキャンバスです。

今朝早く、OpenAI は ChatGPT と共同で、書き込みとプログラミングのための新しいインターフェースである Canvas をリリースしました。

キャンバス: ChatGPTを使った新しいプログラミング方法

まず、キャンバスで何ができるのかを理解しましょう。

テキスト編集:

<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3665116800297074693" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FvI9nYe94fsGhAspRh0lEhWgXO4 CXw0GqbXuJKibnPTdYzSEEpGv3CUMAhTBK1cJI635b9IHPjnIlsjqZRaDr9gA%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7777777777777777" data-w="1920" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&amp;action=mpvideo&amp;auto=0&amp;vid=wxv_3665116800297074693"></iframe>

ビデオソース: https://openai.com/index/intr...

コード編集:

<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3665118256257171464" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FvI9nYe94fsGhAspRh0lEhWgXO4CX w0GqRicic40fIcf2YNGibqaWq9ibknk8JJt5jDUCMK0IMiaY5kHt6tHUz0dUg2Q%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="1.7777777777777777" data-w="1920" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&amp;action=mpvideo&amp;auto=0&amp;vid=wxv_3665118256257171464"></iframe>

ビデオソース: https://openai.com/index/intr...

現在、Canvasを使った素晴らしい成果を共有しているユーザーがいます。例えば、ユーザー@bilawalsidhuは、ThreeJSを使ってChatGPT用のハイパーキューブビューアを作成したプロセスを共有しています。

キャンバス インターフェースを使用すると、チャットだけでなく、ChatGPT を使用してプロジェクトの作成やコーディングに取り組むことができます。

Canvas は新しいインタラクション方法であり、OpenAI が ChatGPT を開始して以来初の大規模なビジュアル インターフェース アップデートです。

Canvasは別ウィンドウで開き、ユーザーはChatGPTとプロジェクトで簡単にコラボレーションできます。Canvasのベータ版では、全く新しいコラボレーション方法を提供します。対話を通して創作するだけでなく、ChatGPTのパートナーとなり、共に創作と改良を重ねていくことができます。

このキャンバスはGPT-4oでサポートされており、ベータ版期間中はモデルセレクターで手動で選択できます。ただし、ベータ版は現在ChatGPT Plusおよびチームユーザーのみが利用可能です。エンタープライズおよび教育機関向けユーザーは来週からアクセス可能になります。無料のChatGPTユーザーは、キャンバスの正式リリースまでお待ちください。

Canvas は正確な変更のためのソリューションを提供します。

ChatGPTを使ったチャットは、ライティングやコーディングなどの情報を得るのに非常に便利です。しかし、ライティングやコーディングにタイムリーな修正を加えたい場合、チャットだけでは不十分な場合があります。

この問題を解決するためにキャンバスが作成されました。

この新しいインターフェースでは、ハイライト機能を使ってChatGPTに重点を置きたい箇所を正確に伝え、ユーザーの意図をより正確に理解させることができます。これは、コンテキスト全体を通して具体的なフィードバックや提案を提供できる編集機能に似ています。

さらに、調整は非常に便利で、コードやテキストを直接編集できます。プロジェクトはあなたのもの、コントロールはあなた次第です。Canvasにはショートカットメニューも用意されており、ChatGPTを使ってテキストの長さを調整したり、コードをデバッグしたり、その他の便利な操作を素早く実行できます。以前のバージョンに戻したい場合は、ワンクリックで簡単に戻ることができます。

クイック書き込み操作、画像ソース: https://openai.com/index/intr...

ChatGPTは、特定のシナリオでキャンバスが役立つと判断すると、自動的にキャンバスを開きます。プロンプトに「キャンバスを使用する」を追加すると、ChatGPTがキャンバスインターフェースに切り替わり、既存のプロジェクトでの作業が容易になります。

キャンバスはコードの反復処理に役立ちます。

コードは反復的なプロセスですが、チャット環境内でコードの改善を追跡するのは困難です。Canvas は ChatGPT の変更プロセスを容易に追跡・理解できるようにし、OpenAI は「このような編集プロセスの透明性を継続的に向上させる」ことを約束しています。

現在、canvas は次のプログラミング ショートカットを提供しています。

  • コードのレビュー: ChatGPT はコードを改善するためのインライン提案を提供できます。
  • ログを追加する: ユーザーがコードをデバッグして理解できるように print ステートメントを挿入します。
  • コメントを追加する: コードにコメントを追加して理解しやすくします。
  • バグ修正: 問題のあるコードを検出し、書き直してエラーを修正します。
  • 多言語エクスポートをサポート:ユーザーコードを JavaScript、TypeScript、Python、Java、C++、PHP などの言語に翻訳できます。

OpenAI はモデルを協力者としてトレーニングします。

OpenAIの研究チームは、GPT-4oをクリエイティブパートナーとして協働できるよう訓練しました。このモデルは、キャンバスを開くタイミング、対象を絞った編集を行うタイミング、そして完全な書き直しが必要なタイミングを認識します。また、より広範なコンテキストを理解することで、正確なフィードバックと提案を提供することができます。

これをサポートするために、研究チームは次の中核となる行動を開発しました。

  • 執筆中やコーディング中にキャンバスをトリガーする
  • 多様なコンテンツタイプを生成する
  • ターゲット編集
  • ドキュメントを書き直す
  • インラインコメントを提供する

OpenAIは、20以上の自動化された内部評価を通じて進捗状況を測定し、OpenAIのO1プレビューからの出力抽出などの革新的な合成データ生成技術を用いて、コア動作に関するモデルの事後学習を行います。このアプローチにより、手動で生成されたデータに依存することなく、文章品質や新しいユーザーインタラクション要件への迅速な適応が可能になります。

R&Dチームにとって重要な課題は、キャンバスをいつ起動するかを決定することでした。OpenAIは、「コーヒー豆の歴史についてのブログ記事を書いてください」といったプロンプトでキャンバスを開くようにモデルをトレーニングし、「新しい夕食のレシピを作ってください」といった一般的な質疑応答タスクでは過剰な起動を避けています。

ライティング課題では、「正しいトリガー」シナリオの改善を優先し(「正しい非トリガー」シナリオを犠牲にして)、83%を達成しました。これは、ベースラインとして機能したゼロサンプルのキューワード GPT-4o と比べて大幅な改善です。

注目すべきは、このようなベースラインの品質は特定の手がかり語に非常に敏感であるということです。手がかり語が異なると、ベースラインのパフォーマンスが低下し、エラー分布も異なる可能性があります。

例えば、コーディングやライティングのタスクでは「均一な不正確さ」が発生する可能性があり、これが様々なエラー分布を引き起こし、パフォーマンスの低下につながります。OpenAIはコーディングにおいて、上級ユーザーの体験を損なわないように、モデルのトリガーを意図的に保守的にしています。また、OpenAIはユーザーからのフィードバックに基づいて、継続的に最適化していくことを約束しています。

ライティングとコーディングのタスクでは、OpenAI はキャンバス決定境界を正確にトリガーする能力を改善し、それぞれ 83% と 94% を達成しました。これは、ベースラインのゼロショット キュー ワード GPT-4o と比べて大幅な改善です。

2 番目の課題は、キャンバスがトリガーされた後のモデルの編集動作を調整すること、特に、ターゲットを絞った編集をいつ実行するか、コンテンツ全体をいつ書き換えるかを決定することです。

OpenAIは、ユーザーがインターフェースを通じて明示的にテキストを選択した場合に、対象を絞った編集を実行するようにモデルをトレーニングしています。それ以外の場合は、コンテンツを書き換える傾向があります。モデルが改良され続けるにつれて、キャンバスの編集動作も絶えず進化しています。

OpenAIは、ライティングとコーディングのタスクにおいて、キャンバスのターゲット編集機能の最適化を優先しました。キャンバスを使用したGPT-4oは、ベースラインのキューベースのGPT-4oよりも18%優れたパフォーマンスを発揮しました。

最後に、高品質なレビューを生成するためのモデルのトレーニングには、慎重な反復作業が必要です。前述の2つのケースでは、詳細な人間によるレビューを補完する自動評価に容易に適応できましたが、レビューの品質を自動測定することは特に困難です。

そのため、OpenAIはコメントの品質と精度を測定するために人間による評価を行っています。OpenAIの統合キャンバスモデルは、プロンプトワードを使用したゼロサンプルGPT-4oと比較して、精度で30%、品質で16%優れた結果を示しています。

これは、合成トレーニングにより、詳細な指示を含むゼロサンプルのプロンプトと比較して、応答の品質と行動パフォーマンスが大幅に向上することを示しています。

Canvas は現在初期テスト段階にあり、OpenAI はその機能を急速に強化する予定です。

「究極の AGI インターフェースは空白のキャンバスです。」

「私の理想とするAGIインターフェースは、白紙のキャンバスです。人間の好みに合わせて進化・変化し、人間との新しいインタラクション方法を生み出し、AI技術やインターネット全体との関係を再定義するでしょう」と、OpenAIの研究ディレクターは述べた。

研究責任者が述べたように、本日のChatGPTアップデートは単なるインターフェースのアップグレードではなく、人間とコンピュータのインタラクションの新たな形態の始まりです。それがもたらす無限の可能性に期待しましょう。

参考リンク:
https://openai.com/index/intr...
https://twitter.com/OpenAI/st...
https://techcrunch.com/2024/1...