|
フランケンシュタインの怪物ゲームプレイがヒットしました。 理由は簡単です。DeepSeek R1、Claude Sonnet 3.5、または OpenAI o1 モデルを単独使用するよりもパフォーマンスが優れているからです。 まずはビデオを見てみましょう: ビデオリンク: https://mp.weixin.qq.com/s/vh...\_CN 別の評価結果を見てみましょう。 Polyglot Benchmarkコード編集ベンチマークでは、ステッチ モデルのパフォーマンスが o1-high と R1 をわずかに上回ります。 このテストでは、 R1 はアーキテクトの役割を果たし、コードの問題を解決する方法を説明します。 クロードさんはプログラマーの役割を果たし、ソース ファイルに変更を適用するために必要に応じて特定のコード編集指示を生成します。 さらに、実験中にいくつかの興味深い結論が導き出されました。
R1とクロード・ソネットは本当に完璧にマッチしているようです! DeepClaude アプリケーション自体は 100% 無料のオープンソースであり、GitHub ですでに 3,000 個のスターを獲得しています (もちろん、独自の API を使用する必要があります)。 テストしたユーザーは、Claude は明確で構造化されたテキストとコードを書くのが得意であり、それが DeepSeek-R1 のアイデアを簡潔な応答に変換できる理由であると結論付けました。 DeepClaude の著者の一人は、これについて次のように考えを述べています。 AI エージェントとそのアプリケーションは、「デジタル世界第一」へのパラダイムシフトを示しており、インテリジェント システムは単なる受動的なツールではなく、積極的な協力者になっています。 DeepSeekとClaudeのハイブリッド具体的には、DeepClaude は Rust で記述された LLM 推論 API です。 これは、DeepSeek R1 の CoT ロジック推論機能と Claude の応答を単一のストリームにシームレスに統合する統合インターフェイスを提供します。 開発者はこの API を使用して両方のモデルの機能を同時に呼び出し、API キーとデータを完全に制御できます。 これを開発したチームはAsteriskと呼ばれています。チームメンバーはセキュリティ研究とCTF(Capture The Flag)の経験を持ち、AIを活用してコードのセキュリティチェックをより効率的に行うことに尽力しています。 チームは、DeepSeek R1 の CoT 深層推論が LLM のメタ認知のレベルにまで達し、自己修正、珍しい/極端な/特別な状況の検討、自然言語でのモンテカルロ ツリー サーチ (MCTS) のような推論の実行が可能になると考えています。 しかし、R1 はコード生成、創造性、対話スキルが不足していますが、Claude 3.5 Sonnet はこれらの領域で優れており、それを補うことができます。 この2つを組み合わせてみませんか?両方の長所を活かしてDeepClaudeを作りましょう! 会話中にクロードが応答する前に、システムは「 DeepClaude はこれら 2 つのモデルを組み合わせ、次の特性を備えています。 マネージド API は完全に無料で、ユーザーは独自のキーを使用でき、DeepSeek と Claude のストリーミング API を統合して、合計使用量と価格の計算などの便利な機能を提供できます。 このコードはオープンソースであり、ユーザーは自由にホスティング、変更、再配布できます。開発チームによると、このコードは既にAsteriskの実稼働環境で大規模に使用されており、毎日数百万のトークンを処理しており、悪用されない限り、今のところ障害は発生していないとのことです。 もう一つ2 つのモデルをつなぎ合わせるのだけが限界だと思いますか? いやいやいや ネットユーザーの中には、DeepSeek-R1とGemini 2.0 Flashの結果を組み合わせ、Claude Sonnet氏に質問に答えてもらうという3部構成のソリューションを開発している人もいます。 彼らはまた、GPQA テスト (Google では見つからない、物理学、化学、生物学の博士課程の学生向けの多肢選択式問題集) でも良い成績を収めました。 Github アドレス: https://github.com/getasteris... 参考リンク: [1]https://aider.chat/2025/01/24... [2]https://x.com/deepclaude_/status/1886911416478642279 [3]https://x.com/omercelik/statu... [4]https://x.com/mufeedvh/status... |
DeepSeek は Claude をステッチし、R1/o1 単体よりも優れたパフォーマンスを発揮します。(GitHub で 3,000 回閲覧)
関連するおすすめ記事
-
インテリジェント運転を標準装備としたBYDの時価総額は1兆元を超える。
-
卓球AIロボットが人間に勝利!フォアハンドとバックハンドをシームレスに切り替え、ネットボールやハイロブも打ち返せる。プロのコーチによると、中級者レベルに到達したとのこと。
-
ヤオクラスの天才たちが創設した大手模型会社が売却された。
-
2024年オープンソースソサエティ年間賞
-
Phi 3.5 mini+vision をワンクリックで導入! マルチモーダル読解ベンチマークデータセット MRR-Benchmark がオンラインになりました。550 組の質問と回答が含まれています。
-
PerplexityがDeep Researchを無料公開:R1、o3-miniなどを上回るパフォーマンス。CEO:DeepSeekに感謝