618ZXW

362 種類の一般的な病気の診断を支援します。ケンブリッジ大学、オックスフォード大学、ウォーリック大学などが、医療知識グラフを自動的に構築するためのマルチエージェント大規模言語モデル フレームワークを提案しています。

今日、医療資源の不足は世界の医療システムを長年悩ませている問題であり、特にプライマリケアと一般診療における「医師不足」は深刻です。世界保健機関(WHO)は、2030年までに世界中で1,500万人の医療従事者が不足すると予測しています。中国では、国家統計局と国家衛生健康委員会のデータによると、医師数は年々増加しているものの、一部の遠隔地や農村部では医師数が十分とは言えません。

階層型医療サービスは、「医師不足」を緩和するための効果的なモデルの一つです。このモデルでは、患者が病院を受診し、自身の問題を特定できない場合、一般開業医が初期診察を行い、問題の大まかな方向性を判断した上で、心臓専門医や神経科医などの関連専門医に紹介し、さらなる診断と治療を行います。この階層型かつ協働的なモデルは、効率的で包括的かつ専門的な診断を可能にし、専門医の負担を軽減し、より的を絞った研修を可能にし、研修サイクルを短縮し、医療資源の迅速な補充を実現します。

しかし、医師の時間とエネルギーは限られています。人工知能などの先端技術をどのように活用して診断効率を高め、医療資源の負担を軽減するかが、産業界の注目を集めています。 前述のヘルスケアにおける階層型協働モデルに着想を得て、ウォーリック大学、クランフィールド大学、ケンブリッジ大学、オックスフォード大学の研究チームは、KG4Diagnosisを提案しました。これは、一般開業医と専門医が2層アーキテクチャを通じて協働する現実世界のヘルスケアシステムをシミュレートする、新しい階層型マルチエージェントフレームワークです。医療知識グラフの構築、診断、治療、推論を自動化するために使用され、スケーラビリティと非構造化データの処理に関する既存の医療知識グラフ構築方法の限界を克服します。肥満など複数の医療分野にまたがる362の一般的な疾患をカバーしています。

関連する研究結果「KG4Diagnosis: 医療診断のためのナレッジグラフ強化機能を備えた階層型マルチエージェント LLM フレームワーク」は、トップカンファレンス AAAI-25 ブリッジ プログラムで発表されました。

MedQA 医療テキスト質問応答データセット:

https://go.hyper.ai/32hkF

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。

https://github.com/hyperai/awesome-ai4s

KG4Diagnosis の革命的な意義は何ですか?

研究者はなぜ KG4Diagnosis を開発したのでしょうか?

これは、人工知能を用いて現実世界の階層型医療システムをシミュレートし、医療診断推論の複雑さを解決するというアイデアから生まれました。こうしてKG4Diagnosisフレームワークが誕生しました。これは、一般開業医向け大規模言語モデル(GPLLM)と複数のドメイン固有の専門家向け大規模言語モデル(Consultant-LLM)を統合した階層型マルチエージェントフレームワークです。一般開業医(GP)エージェントが初期評価とトリアージを実施し、その後、専門医エージェントと連携してドメイン固有の分析を実施します。

このフレームワークはどのように構築されたのでしょうか?

簡単に言えば、5つのステップに分けられます。

KG4診断フレームワークの概要

(1)入力された医療テキストは、ナレッジグラフのコンテキスト制約に適合するデータブロックに分割され、意味ベースのエンティティ抽出モジュールと関係抽出モジュールによって処理されます。

(2)抽出されたエンティティと関係性は専用のデータベースに保存される。

(3)これらのデータベースは医療知識グラフの構築に使用されます。

(4)医療知識グラフを大規模言語モデル(LLM)やマルチエージェントシステムと組み合わせて診断推論を強化する。

(5)診断結果は、人間による推論を通じてユーザーエンドポイントにフィードバックされます。

このアプローチは、大規模言語モデルの幅広い機能と専門的な医学知識の精度を組み合わせることで、より高度な診断結果を実現することは明らかです。研究チームによると、このシステムの学習方法は、複数の医学専門分野にわたる362の一般的な疾患をカバーしており、幅広い医学的診断に対応しています。

このシステムは実際に適用するとどの程度効果的でしょうか?

下の図は、提案された新しいフレームワークが診断プロセスをどのように促進し、AI システムが個人に合わせた医療アドバイスの提供にどのように役立つかを示しています。患者が症状を説明し、医師が明確な質問をし、AI が説明と提案を提供します。

診断対話の例では、患者、医師、AI 医療アシスタント間のやり取りを示します。
  • 患者:「先生、最近、特に夜に耳鳴りがするんです。ずっとブーンという音が鳴っているような感じで、睡眠や集中力に影響が出ています。」
  • 医師:「耳鳴りは持続的ですか、それとも断続的ですか?頭痛、難聴、耳の痛みなど、他の症状はありますか?」
  • AI:「ご不快な思いをされているとのこと、お察しいたします。耳鳴りは、騒音への曝露、耳の感染症、高血圧、ストレスなど、さまざまな要因によって引き起こされる可能性があります。最近、聴力検査や耳の診察は受けられましたか?これらの検査は、耳鳴りの重症度や考えられる原因を特定するのに役立ちます。」

下の図は、肥満に関する知識グラフの分野におけるシステムの専門知識をさらに示しており、肥満、2 型糖尿病、心血管疾患、それらの共通の症状、治療法、合併症との関係を示し、複雑な健康問題に対処する上での薬剤の多面的な役割を強調しています。

肥満分野におけるナレッジグラフの専門性を実証します。

要約すると、本研究は、マルチエージェント検証と知識グラフ制約を用いて、医療診断における大規模言語モデル(LLM)が直面する錯覚の課題に対処し、包括的なベンチマークを通じてこれらのメカニズムの有効性を検証する。さらに、研究者らは、実際の医療シナリオを通してこのフレームワークの実用的価値を実証し、将来の有望な応用を示唆している。

技術も応用も発展中!AI診断支援の未来は明るい。

医療知識グラフ研究の進歩

前述の研究チームが提案するKG4Diagnosisは、知識グラフの拡張に基づく階層型マルチエージェント大規模言語モデルフレームワークです。知識グラフ(KG)とは、物理世界における概念とその関係性を記号的に表現したものです。

現在、医療知識グラフを構築する手法としては、従来のルールベースシステムと高度な人工知能モデルが挙げられます。ルールベース手法は信頼性が高いものの、スケーラビリティに欠けています。一方、GPTやMedPaLMなどの言語モデルは、非構造化データから構造化された知識を生成する可能性を示していますが、錯覚や正確性といった問題に直面しています。

これらの課題に直面し、多くの研究チームが様々な方向性を模索してきました。例えば、知識グラフから関連事実を検索する方法は、大規模言語モデルにおける幻覚の問題に対処する有望なアプローチと考えられています。既存の知識グラフ拡張手法は、多くの場合、各事実の検索と検証を複数回繰り返す必要があり、現実世界のシナリオへの適用を妨げています。インペリアル・カレッジ・ロンドンの研究チームは、医療分野におけるLLM応答の事実性をより少ない検索労力で高めるための、自己改良型拡張知識グラフ検索(Re-KGR)手法を提案しました。「自己改良型強化知識検索による大規模言語モデルにおける幻覚の軽減」と題された彼らの研究結果は、arXivに掲載されました。

一方、医療知識グラフを用いた大規模医療モデルの構築において、ブレークスルーが達成されています。例えば、基礎モデル(FM)は大量のラベルなしデータから学習し、幅広いタスクにおいて優れた性能を発揮します。しかしながら、生物医学分野向けに開発されたFMは、依然として大部分が単峰性です。この限界を克服するため、イリノイ大学カリフォルニア大学(UIUC)の研究チームは、知識グラフを用いて、ある単峰性FMから別の単峰性FMへの変換を学習するBioBRIDGEを提案しました。これは、基盤となる単峰性FMを微調整することなく学習します。

結果は、クロスモーダル検索タスクにおいて、BioBRIDGEがベースラインKG埋め込み手法の最高性能(平均約76.3%)を上回ることを示しています。関連研究「BIOBRIDGE:知識グラフによるバイオメディカル基盤モデルの橋渡し」は、ICLR 2024に採択されました。

人工知能を活用した診断は、効率性の向上と医療資源の不足の緩和に役立ちます。

技術の進歩は、最終的には実用化に貢献し、医師の負担を軽減し、診断の精度と効率を向上させることを目指しています。AIは膨大な医学知識と臨床データを統合することで、近年、診断支援において多くの重要な進歩を遂げてきました。

2024年11月、AI支援診断は国家衛生健康管理局(NHS)のプロジェクト承認ガイドラインに初めて盛り込まれました。これは、比較的成熟したAI支援技術の臨床応用を支援すると同時に、患者への追加負担を防ぐことを目的としています。NHSはAIの潜在的な応用シナリオを分析し、放射線検査、超音波検査、リハビリテーションプロジェクトに「AI支援」拡張項目を設けました。これは、将来のAI支援診断の大規模応用に向けた政策的基盤を築いたと言えるでしょう。

具体的な応用分野としては、2024年2月に華南理工大学のチームがインテリジェント眼疾患スクリーニングシステムの開発を発表しました。このシステムは、データセットで学習したAIモデルや眼底カメラなどの一連のハードウェアデバイスを統合し、眼底カラー写真を撮影してから15秒以内に30以上の疾患の診断提案を行うことができます。

2024年6月、OpenAIは公式ブログで、Color HealthがOpenAIのGPT-4oモデルを用いてAIアシスタント「copilot」を開発し、医師によるがん患者のスクリーニングと治療を支援し、治療効率の向上を実現したと発表しました。公式に公開されたデータによると、AIアシスタントを活用した医療機関は、活用していない医療機関と比較して、病理学的検査結果を4倍多く特定することができました。さらに、AIアシスタントを活用することで、臨床医は患者記録の分析に平均5分しかかかりませんでしたが、AIアシスタントを活用しない場合、データが断片化し、数週間の遅延につながる可能性がありました。

また、報道によると、iFlytekメディカルはAI支援診断を通じて160万件の重大な誤診を修正し、6000万件の不合理または誤った薬物使用の疑いを検出し、草の根レベルでの診断および治療能力を向上させ、誤診や診断漏れを防止したという。

テクノロジーを基盤として、AIは将来的に医師にとって貴重な資産となり、医療サービスのアクセス性と質を継続的に向上させると考えられています。

参考文献:
1.https://arxiv.org/abs/2412.16833
2.https://zh.wikipedia.org/wiki/%E7%9F%A5%E8%AD%98%E5%9C%96%E8%AD%9C
3.https://53ai.com/news/LargeLanguageModel/2024060240513.html
4.https://hub.baai.ac.cn/view/36889
5.https://www.yicai.com/news/102371268.html
6.https://m.yicai.com/news/102153745.html