|
1月24日、百川知能は中国初のフルシナリオ深層思考モデル「Baichuan-M1-preview」をリリースしました。このモデルは、言語、視覚、検索という3つの主要領域における推論能力を同時に備えた、現在中国で唯一のモデルです。数学やコードを含む複数の権威ある評価において、Baichuan-M1-previewはo1-previewを上回る性能を示し、マルチドメイン推論における独自の優位性を実証しました。 さらに、中国で唯一医療分野に特化した大手大規模モデル企業として、Deep Thinking Model は医療証拠に基づくモデルも解き放ち、医療証拠の検索から深い推論まで完全なエンドツーエンドのサービスを実現し、医療臨床および科学研究の質問に迅速かつ正確に答えることができます。 Baichuan-M1-previewがBaixiaoyingで正式にリリースされました。深層思考モードでは、数学、コーディング、論理的推論といった問題に正確に答えられるだけでなく、複雑な医療問題に直面した際にも、まるで上級医療専門家のように深層思考を通じて厳密な医療推論プロセスを構築し、ユーザーに包括的な疾患分析と個別の健康管理アドバイスを提供します。 AIヘルスケアエコシステムの促進と医療分野の発展を支援するため、百川知能は業界初のオープンソース医療拡張モデル「Baichuan-M1-14B」も発表しました。その医療機能は、より大型でパラメータ豊富なQwen2.5-72Bを上回り、o1-miniに匹敵します。 Github: https://github.com/baichuan-i... Huggingface(ベース): https://huggingface.co/baichu... Huggingface(指導): https://huggingface.co/baichu… Baichuan-M1-preview は複数の機能で o1-preview を上回り、医学的証拠に基づくモデルを実現します。あらゆるシナリオに対応する包括的な深層思考モデルであるBaichuan-M1-previewは、強力な言語推論、視覚推論、そして検索推論機能を誇ります。言語推論においては、AIMEやMathといった数学ベンチマークやLiveCodeBenchコーディングタスクにおいて、o1-previewなどのモデルを上回るパフォーマンスを発揮します。 視覚的推論に関しては、MMMU-valやMathVistaなどの権威ある評価におけるそのパフォーマンスは、GPT-4o、Claude3.5 Sonnet、QVQ-72B-Previewなどの主要な国内外のモデルのそれを上回っています。 Baichuan-M1-previewのもう一つの大きな特徴は、医学的根拠に基づくモードがロック解除されていることです。複雑な医学的問題に直面した際、専門的で信頼できる医学的知識を推論の基盤として活用し、ユーザーが最善の医学的判断を下せるよう支援します。 この能力を実現するために、百川知能は数億件のエントリを含む独自のエビデンスに基づく医療知識ベースを構築しました。国内外の医学論文、権威あるガイドライン、専門家のコンセンサス、疾患・症状の分析、薬剤指示など、膨大な専門医療コンテンツを網羅しています。この知識ベースは毎日動的に更新され、医療分野における新たなブレークスルーや進歩を迅速に取り込むことができます。 周知のとおり、医学知識は非常に多様で、その因果関係は複雑です。そのため、膨大な医学知識ベースを構築したとしても、そこから医学知識にアクセスする際、特にインターネット上の医学情報と組み合わせる場合、一部の医学データや理論に矛盾が生じる可能性があります。 この課題に対処するため、エビデンスに基づく医療モデルは、医学的知識とエビデンス評価基準を活用し、エビデンスを複数のレベルに分類し、異なる権威レベルのエビデンスを専門的に分析・統合します。これにより、様々な権威ある情報の出所と信頼性を正確に特定し、情報の混在による誤判断を回避します。そして、この医学的エビデンスに基づいて、信頼性が高く正確な医学的推論が行われ、最終的に信頼できる医学的回答が提供されます。 Baichuan-M1-previewは、「エビデンスに基づく医療モデル」を通じて、エビデンス検索から深い推論まで、包括的なエンドツーエンドのサービスを提供し、医療現場における情報過多、不確実性、断片化といった問題点に効果的に対処します。医師が複雑な症例に直面している場合でも、患者が権威あるアドバイスを求めている場合でも、「事実を提示し、推論を説明する」エビデンスに基づくアプローチを通じて、実質的で論理的な回答を提供します。臨床現場における医師の診断・治療効率の向上や、医学研究における研究時間を大幅に短縮するだけでなく、一般ユーザーが自身の健康状態をより深く理解し、患者が科学的にライフスタイルを管理して治療成果を向上させるのを支援します。 業界初のオープンソース汎用医療強化モデル「Baichuan-M1-14B」は、医療機能においてQwen2.5-72Bを上回っています。医療分野におけるAI技術の革新的な発展を促進し、AI医療技術の透明性と信頼性を高め、医療サービスのアクセシビリティを向上させ、AI医療エコシステムを育成するために、Baichuan IntelligenceはBaichuan-M1プレビューモデルの小型版であるBaichuan-M1-14Bもオープンソース化しました。 業界初のオープンソース汎用医療拡張モデルであるBaichuan-M1-14Bは、非常に優れた性能を発揮しました。cmexam、clinicalbench_hos、erkeといった権威ある医学知識および臨床能力評価において、より多くのパラメータを備えたQwen2.5-72B-Instructを上回るだけでなく、o1-miniとほぼ同等の性能を発揮します。 Baichuan-M1-14Bの医療機能を強化するため、Baichuan Intelligenceは多角的なアプローチを採用しました。データ構築においては、特定の医療シナリオに対応する膨大な量の重要な医療データを収集し、数千万件の中国語/英語の専門医学論文、病院における実際の中国語/英語の医療事例、数億件の医療Q&A、医療相談、臨床データを網羅しました。また、診療科、医療内容、医療価値など、ネットワーク全体のデータの分類と評価を実施し、モデルが価値ある包括的な医療知識を学習できるようにしました。 この基盤を基に、Baichuan Intelligenceは、症例研究、医学書、医療ガイドラインなど、様々なカテゴリーの高品質医療データから、1,000億トークンを超える多様なデータを生成しました。これらのデータは、複雑な医療意思決定の推論チェーン、意思決定基準、質疑応答のペアなど、様々な形式を網羅しています。これらの合成データは豊富な知識提示形式を備え、医師の思考プロセスを反映しており、Baichuan-M1-14Bの医療知識と推論能力をさらに強化しています。 モデルのトレーニング段階に入ると、Baichuan Intelligenceは業界初の多段階ドメイン強化ソリューションを採用し、トレーニングプロセス全体を一般知識強化、基礎医学知識強化、高度医学知識強化の3段階に分割します。これらの段階を通じて、モデルの基本言語スキル、高度な知識、そして複雑で困難な症例への対応能力が順次向上します。さらに、CoTトレーニングフレームワークにELO強化学習を革新的に導入することで、思考プロセスパスを最適化し、従来の報酬モデルに内在するバイアスを回避し、モデルの生成品質と論理的推論能力を効果的に向上させます。 Baichuan-M1-previewは、AIヘルスケア分野におけるBaichuan Intelligenceの新たな大きな飛躍であり、AIを通じて「医師を育成し、治療の道筋を変え、医療を進歩させる」という同社のビジョンを力強く支えています。また、Baichuan-M1-14Bオープンソースモデルは、中国のAIヘルスケアエコシステムの構築を強力に支援します。Baichuan Intelligenceは、医療分野におけるAI技術の普及を加速させるだけでなく、さらなるイノベーションを促し、中国のヘルスケアエコシステムの継続的な発展を共に促進し、より公平で効率的かつ高品質な医療サービスの実現に貢献することを目指しています。 *この記事はQuantumBitからの許可を得て公開されており、表現されている見解は著者の見解のみです。 |
フルシナリオのディープシンキングモデルをリリース:3つの主要な推論能力を網羅し、エビデンスに基づく医療モデルを解き放つ
関連するおすすめ記事
-
ライブ配信のお知らせ | タンパク質最適化における画期的進歩!浙江大学の成果がNeurIPS 2024に選出、筆頭著者が技術ハイライトを解説
-
[TVMチュートリアル] 線形カーネルと再帰カーネル
-
マスク氏、一夜にして1兆ドルを稼ぎ出す!テスラは第3四半期に大成功を収める:46万台を納車、新型モデルYが上海で生産ラインから出荷されたと報道。
-
L3商用化の初年度に、北京は支援政策の導入を主導した。
-
オンラインチュートリアル | 史記夫人は一瞬で「四川・重慶の少女」に変身できるか?Step-Audio-TTSは音声複製・音楽合成・音声合成をワンストップで実現
-
国家スーパーコンピューティング インターネット プラットフォームが、現在、無料のコンピューティング パワーを提供しています。