618ZXW

数学、コーディング、科学、パズルを網羅した高品質の推論データセットのコレクション。DeepSeek の強力な推論機能を再現するのに役立ちます。

DeepSeek-R1によって刺激された推論モデルの人気は、最近ますます高まっています。1月31日にはOpenAIが新しい推論モデルo3-miniをリリースしました。2月18日にはxAIがGrok 3をリリースしました。これには推論機能を備えたGrok-3 Reasoning BetaとGrok-3 mini Reasoningが含まれています。そして2月25日には、Anthropicが初のハイブリッド推論モデルであるClaude 3.7 Sonnetをリリースしました。

実際、大規模モデルの均質化が進み、競争が激化する中で、推論能力はAIがAGIへと進化するための重要なパフォーマンス指標となり、重要な方向性となっています。しかし、アルゴリズムの最適化の限界がますます明らかになり、モデルのパラメータが徐々に限界まで圧縮されるにつれて、データ品質は、モデルが単純な「回答の記憶」から深い「論理的推論」へと進化できるかどうかを左右する重要な要素の一つとなっています。

推論データセットの構築は、単に質問を積み重ねるよりもはるかに複雑です。モデルがトレーニング中に情報を漏洩したり、テスト中に不正行為をしたりするのを防ぐため、データはトレーニングセットから厳密に分離され、質問の種類を定期的に更新する動的更新メカニズムが導入されなければなりません。数学的な証明やコード生成といった複雑なタスクを扱う場合、データセット構築では、複数の論理チェーンを慎重に設計し、隠れた罠の条件を巧みに設定することで、人間の問題解決における試行錯誤と思考プロセスを可能な限りシミュレートし、より現実世界の応用シナリオに近い学習教材をモデルに提供する必要があります。

AIME数学コンペティションにおけるDeepSeekの卓越したパフォーマンスはその好例です。DeepSeekが利用しているOpenThoughts-114kデータセットは、段階的な推論と複数の論理的連鎖を必要とする一連の問題を網羅しています。厳密な検証メカニズムと巧みに配置された多段階推論構造により、DeepSeekはデータの正確性と信頼性を確保すると同時に、モデルが単に「記憶」に頼って質問に答えるのではなく、より深い推論能力をデータから学習することを可能にします。

結論として、DeepSeekの成功は、高品質な推論データセットへの業界の注目を一気に高めました。HyperAIは、数学、コード、科学、パズルなど、複数の分野を網羅した、現在人気の推論データセットのリストをまとめています。これらのデータセットは、大規模モデルの推論能力を大幅に向上させたいと考えている実務家や研究者にとって、間違いなく優れた出発点となるでしょう。

その他のオープンソース データセットを表示するにはクリックしてください。

https://go.hyper.ai/CdPJZ

推論データセットの概要

1. OpenThoughts-114k推論データセット

推定サイズ: 922.07 MB

ダウンロードリンク: https://go.hyper.ai/SaAit

Open Thoughtsが2025年に公開したこのデータセットは、数学、コード、科学、パズルなどの分野に焦点を当てており、114,000件の高品質サンプルが含まれています。小規模な推論モデルを訓練することで、数学およびコード推論タスクにおいて既存の大規模モデル(DeepSeek-R1-Distill-Qwen-32BやDeepSeek-R1-Distill-Qwen-7Bなど)を上回る性能を実現することを目的としています。

2. Bespoke-Stratos-17k推論タスクデータセット

推定サイズ: 125 MB

ダウンロードリンク: https://go.hyper.ai/nLGos

このデータセットは、推論タスク向けに特別に設計された高品質なデータセットです。コード、数学・科学パズルなど、複数の領域を網羅した質問、推論トレイル、そして回答が含まれており、高性能推論モデルの学習を支援することを目的としています。データセットは以下の3つの部分で構成されています。

* プログラミングデータ: APP および TACO からの 5,000 データポイント * 数学データ: NuminaMATH データセットの AIME、MATH、および Olympiads サブセットからの 10,000 データポイント

* 科学とパズルのデータ: STILL-2 からの 1,000 のデータ ポイント

3. Dolphin-R1推論データセット

推定サイズ: 2.24 GB

ダウンロードリンク: https://go.hyper.ai/grwUo

Dolphin-R1推論データセットには、DeepSeek-R1、Gemini Flash、そしてDolphin Chatから提供された約80万サンプルが含まれています。このデータセットは、DeepSeek-R1と同様の推論モデルの学習に使用できる高品質なサンプルを提供することを目的としています。これらのサンプルは主に、数学、論理、コーディングといった複雑なタスクを含む推論タスクにおけるモデルのパフォーマンス向上に使用されます。

4. LIMO数学推論ベンチマークデータセット

推定サイズ: 4.22 MB

ダウンロードリンク: https://go.hyper.ai/0p72o

LIMO数学推論ベンチマークデータセットには、わずか817個の高品質な数学推論サンプルが含まれています。厳選された高品質なトレーニングサンプルを用いることで、大規模モデルの数学的推論能力をトレーニングおよび評価することを目的としています。このデータセットは主に、大規模モデルの数学問題解決能力をトレーニングし、数学試験やコンテスト(AIME、MATH-500など)におけるパフォーマンスを向上させるために使用されます。

5. NuminaMath-1.5 数学的推論データセット

推定サイズ: 446.62 MB

ダウンロードリンク: https://go.hyper.ai/qVAgO

NuminaMath-1.5 数学推論データセットは、数学教育および競技問題に適しています。約90万問の高品質な競技レベルの数学問題が収録されており、各問題の解答はChain-of-Track(CoT)形式で提示されています。これらの問題は、中国の高校数学演習、および米国および国際数学オリンピックの問題から抽出されています。

6. OpenR1-Math-220k 数学推論データセット

推定サイズ: 8.44 GB

ダウンロードリンク: https://go.hyper.ai/nuhSv

OpenR1-Math-220kは、DeepSeek R1の合成データの不足を補うために、Open R1チームが2025年に公開した大規模な数学推論データセットです。このデータセットには、DeepSeek R1によって生成された80万の推論パスから派生した、22万件の高品質な数学問題とその推論パスが含まれています。

7. 中国のDeepSeek R1 Distillデータ

推定サイズ: 376 MB

ダウンロードリンク: https://go.hyper.ai/8Podu

このデータセットは、中国のオープンソースで本格的なR1データセットです。数学データだけでなく、合計11万件に及ぶ多数の一般データも含まれています。具体的には、以下の通りです。

* 数学: 36,987 サンプル

* 試験:2,440サンプル

* STEM: 12,000サンプル

* 一般:「Idiot Bar」「Logical Reasoning」「Xiaohongshu」「Zhihu」、Chat などのフォーラムからのサンプルを含む 58,573 件。


上記はHyperAIによる推論データセットの集大成です。hyper.ai公式サイトに掲載されているリソースで、掲載を希望されるものがありましたら、お気軽にメッセージをお送りいただくか、ご自身の作品をご提出ください。

HyperAI (hyper.ai) について

HyperAI(hyper.ai)は、中国を代表する人工知能(AI)および高性能コンピューティング(Hyper.ai)コミュニティであり、中国のデータサイエンス分野のインフラとなることを目指し、国内の開発者向けに豊富で高品質な公開リソースを提供しています。これまでに以下の実績があります。

* 1200以上の公開データセットの国内高速ダウンロードノードを提供

* 300以上の古典的かつ人気のあるオンラインチュートリアルが含まれています

* 100以上のAI4Science論文事例を分析

* 500以上の関連用語の検索をサポート

* 中国で初めて Apache TVM の完全な中国語ドキュメントをホストします。

公式ウェブサイトにアクセスして学習を始めましょう:

https://hyper.ai