618ZXW

クロード4が近日発売か!DeepSeekに追い込まれ、ついに切り札まで出てきました。

ついに!ついに! Claude 4が今後数週間以内にリリースされるという噂です

重要な点を強調すると、最新バージョンでは以前のモデルとは異なるアプローチが採用されています。

ハイブリッド大型モデルです。

簡単に言えば、推論能力を備えており、より多くの計算能力を使用して難しい問題を考えて解決できます。また、単純な問題に直面した場合は、不必要な労力をかけずに、従来の大規模モデルのように迅速かつ効率的に処理することもできます

どうでしょう?昨日ウルトラマンが公開したGPT-5によく似てないですか?(doge)

従来の一般モデルと推論モデルを分離するのではなく、それらを直接統合します。

Anthropic は今後数週間以内にこのモデルをリリースする予定であることが明らかになりました。

インターネットを徹底的に検索した結果、早くも4日前に誰かが我慢できずにTwitterでネタバレを漏らしていたことが判明した。

Anthropicの社員から、今週中にClaude 4と推論モデルをリリースする予定だと聞きました。パフォーマンスに関しては、本格的なO3を凌駕しています!

諺にもあるように、噂は往々にして信頼できないので、期待については慎重になるべきです。

でもやっぱり楽しみで仕方ないですね!

以下に、より詳細なネタバレを見ていきましょう。

Claude 4 は異なるアプローチを採用しており、使用中に推論コストを制御できます。

前述の通り、クロード4はこれまでの一般的な大型モデルとは異なります。

汎用モデルと推論モデルを統合し、特定のタスクに応じて必要な計算能力と機能を調整します

複雑な問題に直面したときは推論能力を使用し、単純な問題に直面したときは一般的なモデルを使用します。

さらに、ユーザーは各質問に必要なトークンの数を制御できます。つまり、特定の質問ごとに考え、推論するのにかかる時間を指定できます。

実際には、ユーザーはバーニヤ定規を使用してスケールを調整することができ、スケールには「タスクを完了するために必要なトークンの数」がマークされています。

カーソルを「0」までスライドすると、Claude 4 は推論機能のない従来の大規模 AI モデルになります。

スライドする値が大きくなるほど、使用される計算能力が増加し、思考および推論のプロセスが長くなります。

実際、OpenAI の現在のモデルにも同様の機能があります。

ただし、 OpenAI では「低」、「中」、「高」の 3 つのレベルのみを提供しており、ユーザーは適切な推論の強度を選択できます。

しかし、モデルが各レベルで実際にどれだけのトークンを使用するかを予測することは難しいため、多くのユーザーから「3 つのレベルでは使用コストを効果的に制御できない」という報告があります。

ただし、これは OpenAI と Anthropic の市場でのポジショニングに関係している可能性があります。

OpenAI は一般ユーザーや個人開発者向けに設計されており、その 3 層システムはよりシンプルで理解しやすく、操作も便利です。

一方、Anthropic はエンタープライズ市場に重点を置いており、比較的 B2B であるため、調整にはバーニア スケールを使用し、ユーザーがコスト、速度、その他の側面を制御できるようにしています。

2 つの機能を組み合わせた汎用推論ツール: 次の大きなトレンドになるでしょうか?

ご覧のとおり、海外の大規模モデリングにおける最強の2社であるAnthropicとOpenAIは、どちらも次のステップを明確に定義しています。

一般モデルと推論モデルを 1 つに結合します。

数週間後にリリースされるClaude 4や、数か月後にリリースされるGPT-5にも同様に適用されます。

これは、大型台座模型愛好家にとって、次の共通の選択肢となるかもしれません。

従来のスケーリング則が壁にぶつかりつつあるというコンセンサスが得られ、トレーニング、推論、CoT の重要性が日々高まっている現状では、推論が一般的なモデルにとって必須のスキルとなるのは避けられないように思われます。

しかし、 Anthropic は市場で独自の確固たる地位を築いています。それは Claude シリーズであり、そのプログラミング機能は常にトップクラスです

さらに、大企業のエンジニアが求めるレベルのプログラミング業務にも優れています。

たとえば、Claude シリーズは、何千ものファイルで構成される複雑なコードベースを理解し、最初の試行で完璧に実行される完全なコードを生成するのに優れています。

これは本当に面白いですね!

複雑なプログラミングの問題に直面すると、大規模な AI モデルは実際のコードを出力せずにコメントのみを提供するという近道を取ることがよくあります。

しかし、Claude 4の価格がいくらになるかはまだ不明です。

o3-miniよりも安くなるでしょうか?DeepSeek-R1よりも安くなるでしょうか?Google 2.0 Flash-Liteよりも安くなるでしょうか?

まだ誰も知らない。

しかし、一部のネットユーザーは大多数の感情を次のように表現した。

1,000 ドルを費やしても解決したい問題が解決されないのであれば、それは完全にお金の無駄ではないでしょうか?

はっきり言って、ある実用能力において「無敵の強さ」を持っていない限り、価格面で愛好家ができるのは、DeepSeek や Google 2.0 Flash-Lite のようなモデルだけなのかもしれません。

(心苦しいですが)まずは大幅に値下げして、また値下げして、また値下げして…

参考文献: [1] https://x.com/iruletheworldmo... [2] https://x.com/kimmonismus/sta...