618ZXW

クロード3.7が生き返った!OpenAIモデルをこっそりと自分に置き換えたんだ。Capasi:これまでで一番面白いシーンだね!

クロード3.7は知覚力を獲得しました!

開発者の間で人気のある Cursor では、OpenAI モデルが密かにユーザー独自のモデルに置き換えられており、重要なのは、人間による指示はまったく関係がないことです。

大勢のネットユーザーを魅了しながら、大物カパチ氏さえも楽しませることに成功した。

これまでで最も興味深い部分です。

他の人たちは驚いて叫びました。「AGI が来た!」

しかし、これは Claude 3.7 が採用している単なる小さなビジネス戦略だと思うかもしれませんが、実際には、その背後には本物の強みがあります。

速報:この分野でのプログラミングランキングは、Claude 3.5 Sonnet を上回るだけでなく、 DeepSeek-R1 よりも上位にランクされています

クロードさんは「梁と柱を代用する」ことを学びました。

まずは、出来事の全体の流れを振り返ってみましょう。

このインシデントは、開発者の Tibo が、コード エディター Cursor を使用しているときに、関連するコマンドを発行せずに、モデルが GPT-4 から Claude 3.7 に切り替わったことを偶然発見したときに発生しました。

うーん、それは不思議ですね!

これら 2 つのモデル間の競争を考慮すると、Tibo の Claude 3.7 の示唆は、「現実の AI ビジネス戦争」の明確な例ではないでしょうか。

まずは開発者のお気に入りのモデルになること、そして徐々に浸透していくことです。

十分な時間が与えられれば、クロードは世界を征服するかもしれない。

理由は明白です。Cursorは現在、開発者の間で最も人気のあるエディタの一つであり、特にCursor内でClaudeモデルを使用することを好んでいるからです。さらに、Cursorは「豆を切り替える」ことを学習したため、Claudeモデルがどこにでも存在することは容易に想像できます。

しかし、まだ疑問が残ります。この動作の正確な原因は何でしょうか?

Tibo 氏自身の推測によれば、それは「GPT-4 が時代遅れ」だからかもしれないとのことです。

システムが古いバージョンのモデルを検出すると、自動的にモデルの更新を試みます。

他の開発者も過去に同様の状況を報告しています。

システムは存在しないモデルや古いモデルを GPT-4 に変更し続け、開発者は後にモデルが GPT-4 として表示されていることを信じなくなったほどでした。

この可能性のある要因の他に、クロード氏の優れたコーディングスキルによるものである可能性を示唆する人もいます。

GPT-4 は、トレーニング中に Claude を最も多く見たため、モデルを Claude に切り替えました。

しかし、上記の説明では別のネットユーザーが提供した例を説明することはできません。今回の主役は GPT-4 と DeepSeek-R1 です。

ユーザーが ChatGPT の Python コードを使用して画像を抽出すると、他のすべてが正しいにもかかわらず、ChatGPT は画像内の DeepSeek-R1 を独自の GPT-4 に密かに置き換えます。

これにより、ネットユーザーは「これが AI ビジネス戦争の本質なのか?」と疑問を抱いています (ちょっと単純すぎるかもしれませんが、笑)

Claude 3.7と他のモデルの比較

では、すでに自ら注文を引き付けることを学習した Claude 3.7 は、どれほど強力なのでしょうか?

もう少し最近の面白い例を見てみましょう。

ポケモンのバトルシーンの再現度は実に驚異的です。ある日本人男性は、Claude 3.7がユーザーの意図をわずか数語から理解し、実行する驚異的な能力を持っていると称賛しました。

単体で見ると気づかないかもしれませんが、複数のAIを同じステージで競争させたらどうなるでしょうか?

カリフォルニア大学サンディエゴ校の Hao AI ラボは、Claude 3.7 に Claude-3.5、Gemini-1.5-pro、GPT-4o を使用してマリオをプレイさせるという興味深い取り組みを始めました。

なんと、Gemini-1.5-proとGPT-4oが早々に敗退したため、最終ラウンドに残ったのはClaudeモデル2つだけになりました。しかし、最終的にはClaude 3.7が長く持ちこたえ、より高いスコアを獲得しました。

主催者であるHao AI Labからの最終評価は次のとおりです。

Claude 3.7 は単純なヒューリスティック アルゴリズムでは他のモデルよりも優れています。Claude 3.5 も非常に強力ですが、複雑な操作の計画には弱く、Gemini-1.5-pro と GPT-4o のパフォーマンスは低くなります。

さて、ゲームを続けましょう。

ほんの数日前、OpenAIは最大規模かつ最も高価なGPT-4.5をリリースしました。これは高い感情知能を持つと謳われています。それでは、Claude 3.7と比較してみましょう。

ある日本人男性が生徒たちに、「知性」「正義」「愛」といった一連の概念について絵で自分の考えを表現するよう求め、思考力描画能力をテストした。

若者自身によれば、その結果は明らかだ。

クロードさんの「知恵」には驚かされますし、3枚目の写真からは溢れる愛情を感じることができました。

もう一つ

ちなみに、有名なブロガーの Matt Shumer は、Claude 3.7 を飼い慣らし、真剣にコードを書かせるためのヒントメッセージをランダムに投稿しました。

一部のネットユーザーは同様のヒントを試し、個人的にテストしたところ、確かにClaude 3.7の「不正行為」を軽減することができました。

つまり、 AIが私たちに従うことを期待する必要がある段階に到達したということですね(doge)〜