|
元 Apple および SpaceX のエンジニアが o1 の使用体験をシェアし、Ultraman と Brockman によって再投稿されました。 要点: o1 はもはやチャット モデルではないため、まったく新しい使用方法が必要になります。 ウルトラマンはまた、数日前に著者ベン・ハイラックが書いた矛盾したコメントを掘り起こし、「O1の評判の変化や人々がどのようにそれを使うことを学ぶかを観察するのは興味深い」と述べた。 ベン・ハイラック氏は、以前はSpaceXでソフトウェアエンジニアとして、またAppleのVisionOSでヒューマン・コンピュータ・インタラクション・デザイナーとして勤務していました。現在、AI製品向けの分析サービスを提供する事業を立ち上げています。 具体的には、ベンは o1 pro のフル機能版(月額 200 ドル)をリリース初日に購入し、丸一日テストした結果、本当にひどいという結論に至りました。
ベンが自身の恐ろしい体験をオンラインで共有した後、多くの人が同じ意見を表明しました。しかし興味深いことに、強く反対する人もいました。 彼は異なる見解を持つ人々と議論を始め、そして自分のアプローチが完全に間違っていたことに気づきました。 私はまだ O1 をチャット モデルとして使用していますが、O1 はもはやチャット モデルではありません。 今では、ベンは O1 を嫌っていた状態から、最も重要な問題を解決するために毎日使用する状態になりました。 O1を新入社員のように扱うO1 がチャット モデルではなくなったら、今は何なのでしょう? Benはこれを「レポートジェネレーター」のようなものだと考えています。十分なコンテキストを与え、出力したい内容を伝えれば、通常は最初の試みで解決策を見つけてくれます。 OpenAI は、o1 の使用に関してシンプルだが不完全な提案を提供しています。 Ben の提案は次のとおりです。 豊富な背景情報を提供する「大規模」に対する現在の理解に関係なく、それを 10 倍にします。 GPT-4oやClaude 3.5などのチャットモデルを使用する場合、通常は簡単な質問と背景情報から始まります。モデルがさらに背景情報を必要とする場合は、通常、その情報を提供するよう求められます。 これがチャット モデルの本質です。双方向のやり取りを通じて出力を継続的に改善します。 ただし、O1は質問に表面的にしか答えず、背景情報を聞き出そうとはしません。そのため、できるだけ多くの背景情報を積極的に送信する必要があります。 単純なコード エンジニアリングに関する質問をする場合でも、次の情報を提供する必要があります。
つまり、O1 を新入社員のように扱うのです。 やり方を指示するのではなく、何が欲しいのかを説明してください。ほとんどのチャット パターンでは、「ソフトウェア エンジニアリングの専門家の役割を演じて、慎重に考える」など、パターンに期待される応答方法を伝えます。 しかし、O1 での効果的なアプローチはその逆です。つまり、やり方を指示するのではなく、必要なことを伝えるのです。 Ben は、o1 プロンプト ワード テンプレートを 4 つの部分に分割しました。
最後に、O1の出力は学術/ビジネスレポート風のスタイルです。ベンは、推論トークンの過剰な使用がこのスタイルを打破する上で困難を招いていると考えています。 彼は O1 に論文を完成させようとしましたが、何度か試みた後も、得られるのはごく平凡な学生の論文だけでした。 もう一つウルトラマンの投稿をリツイートしたところ、誰かが最新情報を抜き出しました。 o3 は当面ユーザーには提供されませんが、まず o3-mini が間もなくリリースされる予定です。 o3-miniはまずPlus加入者に提供されます。OpenAIはAPIの価格をまだ決定していませんが、それほど高額にはならない予定です。 参考リンク: |
o1はもはやチャットボットではありません!元SpaceXエンジニアが、嫌っていたo1を毎日頼りにする新しい使い方のヒントを公開。
関連するおすすめ記事
-
徹底分析 | 李菲菲:AGIとは何か分からない
-
Cyan Creative は、感情と温かさを表現する完全に人間のようなロボット、OrcaⅠ を発表しました。
-
第 9 回中国オープンソース年次会議とオープンソース協会 10 周年記念カーニバルが成功裏に終了しました。
-
3500人民元、人間の動きを1:1で再現したヒューマノイドロボット | 上海AIラボの新たなオープンソース成果
-
Alphafold3 の依存関係データベースが利用可能になりました! ICLR 満点論文 IC-Light: 照明色相特徴の正確な識別。
-
えっ?Appleは自動運転車の最先端研究(SOTA)をしているけど、製造は中止したんじゃないの?