618ZXW

Andrew Ng は OpenAI と協力して、新しい O1 推論コースを開始しました。しかも無料です!

データホエール

Datawhaleのヒント

新しいレッスン: O1 推論、編集者: Machine Heart

Oシリーズモデルは、推論中に思考連鎖推論を実行することで、多段階計画、画像推論、長期コーディングといった新たなユースケースにおいて優れた性能を発揮します。では、Oシリーズモデルは複雑な推論を必要とするアプリケーションの構築に具体的にどのように活用できるのでしょうか?

最近、OpenAI は著名な AI 研究者でスタンフォード大学の Andrew Ng 教授と共同で、OpenAI の戦略ソリューション アーキテクチャ責任者である Colin Jarvis が教える「Reasoning with o1 」と題した o1 を使った推論に関する無料の DeepLearning.AI コースを開始しました。

コースリンク: https://www.deeplearning.ai/s...

O1 による推論コースの主な内容は次のとおりです。

  • o1 即時エンジニアリングの基礎知識
  • 複数ステップのタスクの計画と実行
  • コードの作成と編集
  • 画像推論
  • メタプロンプティングはモデルのパフォーマンスを向上させることができる

このコースを通じて、学生は次のことができるようになります。

  • o1、その動作原理、パフォーマンス、およびそれを使用するための最適なシナリオを理解します。
  • o1 を効果的にプロンプ​​トする方法と、よりコスト効率が高く、レイテンシが低いモデルにタスクを委任するタイミングを学習します。
  • o1 がコーディングと視覚的推論タスクで優れている点と、メタプロンプティングを適用してアプリケーションを最適化する方法を学びます。

具体的には、「Reasoning with o1」コースでは、OpenAI が強化学習を使用して「テスト時の計算」を使用するモデルを構築し、推論タスクのパフォーマンスを向上させる方法を学びます。また、「思考の連鎖」とは何かを理解し、o1 がそれ​​を自律的に使用して問題を小さなステップに分割し、複数の戦略を試し、質問に答える前に慎重に考える方法を学びます。

O1モデルは抽象的推論タスクに優れています。計画、コーディング、分析、分野特有の推論(例:法律)、STEM科目といったタスクにおいて、記録破りのパフォーマンスを誇ります。O1推論コースでは、以下の内容をカバーします。

  • o1 モデルがどのタスクに適しているか、また、より小さいモデルやより高速なモデル、あるいはその両方の組み合わせをいつ使用するかを識別する方法を学習します。
  • ヒントに o1 を使用する 4 つの重要な原則を学び、パフォーマンスの違いを調べます。
  • o1 がコーディネーターとして機能して計画を作成し、それを 4o-mini モデルに渡して順次実行し、インテリジェンスとコストのトレードオフのバランスをとる、マルチステップ タスクを実装します。
  • o1 を使用してコーディング タスクを実行し、新しいアプリケーションを構築し、既存のコードを編集し、o1-mini と GPT 4o の間でコーディング コンテストを実行してパフォーマンスをテストします。
  • 私たちは画像理解に o1 を使用し、階層的推論によってパフォーマンスを向上させる方法を学びました。階層的推論では、事前に遅延とコストが発生し、画像が前処理され、質問への回答で後で使用するために詳細な情報でインデックスが付けられます。
  • o1 を使用してプロンプトを改善するためのメタプロンプティングと呼ばれるテクニックを学びます。

どうしてですか?学ぶためにここに来たのですか?

コースリンク: https://www.deeplearning.ai/s...

いいね (3件のいいね!)↓