618ZXW

o1はもはやチャットボットではありません!元SpaceXエンジニアが、嫌っていたo1を毎日頼りにする新しい使い方のヒントを公開。

元 Apple および SpaceX のエンジニアが o1 の使用体験をシェアし、Ultraman と Brockman によって再投稿されました。

要点:

o1 はもはやチャット モデルではないため、まったく新しい使用方法が必要になります。

ウルトラマンはまた、数日前に著者ベン・ハイラックが書いた矛盾したコメントを掘り起こし、「O1の評判の変化や人々がどのようにそれを使うことを学ぶかを観察するのは興味深い」と述べた。

ベン・ハイラック氏は、以前はSpaceXでソフトウェアエンジニアとして、またAppleのVisionOSでヒューマン・コンピュータ・インタラクション・デザイナーとして勤務していました。現在、AI製品向けの分析サービスを提供する事業を立ち上げています。

具体的には、ベンは o1 pro のフル機能版(月額 200 ドル)をリリース初日に購入し、丸一日テストした結果、本当にひどいという結論に至りました。

  • 各質問には 5 分間の待機が必要です。
  • 矛盾した提案が出力されます。
  • 要件はありませんが、アーキテクチャ図と利点/欠点のリストが常に返信されます。

ベンが自身の恐ろしい体験をオンラインで共有した後、多くの人が同じ意見を表明しました。しかし興味深いことに、強く反対する人もいました。

彼は異なる見解を持つ人々と議論を始め、そして自分のアプローチが完全に間違っていたことに気づきました。

私はまだ O1 をチャット モデルとして使用していますが、O1 はもはやチャット モデルではありません。

今では、ベンは O1 を嫌っていた状態から、最も重要な問題を解決するために毎日使用する状態になりました。

O1を新入社員のように扱う

O1 がチャット モデルではなくなったら、今は何なのでしょう?

Benはこれを「レポートジェネレーター」のようなものだと考えています。十分なコンテキストを与え、出力したい内容を伝えれば、通常は最初の試みで解決策を見つけてくれます。

OpenAI は、o1 の使用に関してシンプルだが不完全な提案を提供しています。

Ben の提案は次のとおりです。

豊富な背景情報を提供する

「大規模」に対する現在の理解に関係なく、それを 10 倍にします。

GPT-4oやClaude 3.5などのチャットモデルを使用する場合、通常は簡単な質問と背景情報から始まります。モデルがさらに背景情報を必要とする場合は、通常、その情報を提供するよう求められます。

これがチャット モデルの本質です。双方向のやり取りを通じて出力を継続的に改善します。

ただし、O1は質問に表面的にしか答えず、背景情報を聞き出そうとはしません。そのため、できるだけ多くの背景情報を積極的に送信する必要があります。

単純なコード エンジニアリングに関する質問をする場合でも、次の情報を提供する必要があります。

  • これまで試したがうまくいかなかった解決策をすべて説明してください。
  • 完全なデータベーススキーマ
  • あなたの会社の事業内容、規模、社内用語の定義を説明します。

つまり、O1 を新入社員のように扱うのです。

やり方を指示するのではなく、何が欲しいのかを説明してください。

ほとんどのチャット パターンでは、「ソフトウェア エンジニアリングの専門家の役割を演じて、慎重に考える」など、パターンに期待される応答方法を伝えます。

しかし、O1 での効果的なアプローチはその逆です。つまり、やり方を指示するのではなく、必要なことを伝えるのです。

Ben は、o1 プロンプト ワード テンプレートを 4 つの部分に分割しました。

  • 目標を第一に
  • 出力形式を詳細に指定する
  • 確認が必要な注意事項を追加できます。
  • 関連する豊富な背景情報

最後に、O1の出力は学術/ビジネスレポート風のスタイルです。ベンは、推論トークンの過剰な使用がこのスタイルを打破する上で困難を招いていると考えています。

彼は O1 に論文を完成させようとしましたが、何度か試みた後も、得られるのはごく平凡な学生の論文だけでした。

もう一つ

ウルトラマンの投稿をリツイートしたところ、誰かが最新情報を抜き出しました。

o3 は当面ユーザーには提供されませんが、まず o3-mini が間もなくリリースされる予定です。

o3-miniはまずPlus加入者に提供されます。OpenAIはAPIの価格をまだ決定していませんが、それほど高額にはならない予定です。

参考リンク:
[1]https://www.latent.space/p/o1... [2]https://x.com/sama/status/187... [3]https://x.com/gdb/status/1878...