618ZXW

エージェント心理クリニックが開設!上海交通大学のチームは、1,300件のうつ病相談対話に基づいて、うつ病の初期診断が可能な大規模モデル対話エージェントを構築しました。

メンタルヘルスの問題は、今日の社会が直面する最大の課題の一つです。WHOの世界メンタルヘルス報告書によると、うつ病に苦しむ人は約2億4,600万人に上り、これは10万人あたり平均3,153人に相当します。うつ病は最も一般的な精神疾患の一つと言えるでしょう。

しかし、メンタルヘルスに関する資源は、特に低所得国・中所得国において依然として不足しています。さらに、すべての国・地域において、専門的なメンタルヘルス資源は都市部や大規模施設に集中しており、病院における資源配分の不均衡が生じています。このため、うつ病などの精神疾患に苦しむ患者が、タイムリーかつ適切な医療サポートを受けることが困難になっています。

医療資源をより適切に配分し、資源制約を緩和するためには、うつ病の効率的かつ正確な自動診断方法が不可欠です。様々な自動診断方法の中でも、会話エージェントは、費用対効果、時間節約、そしてユーザーの匿名性を維持できることから、非常に効果的であると考えられています。注目すべきは、診断会話が深まるにつれて、エージェントの対話戦略は患者の精神状態や医師と患者の関係の進展に適応する必要があり、これは間違いなく会話エージェントの開発にとって大きな課題となるということです。

上記の問題に対処するため、上海交通大学X-LANCEラボの呉孟岳教授のチームは、テキサス大学アーリントン校(UTA)、天橋脳科学研究所(TCCI)、ThetaAIと協力し、うつ病の初期診断を目的とした自動化された大規模モデル対話エージェントシミュレーションシステム「エージェントメンタルクリニック(AMC)」を開発しました。このシステムは、精神科医と潜在的なうつ病患者を同時にシミュレートし、うつ病の診察対話をシミュレートすることができます。さらに、対話プロセスを最適化し、精神科医を導くために、AMCには次回の対話を指導するメンターの役割も含まれています。システム内のすべての役割は、人間が演じることも、大規模モデルを使用して実装することもできます。

AMCは、診断環境のニーズにより適切に適応するため、広く普及している大規模モデルエージェント構築アプローチを採用するとともに、三層記憶ストレージ構造と新たな記憶検索メカニズムを提案し、より効率的かつ正確なうつ病相談と初期スクリーニングを実現します。この対話システムは、うつ病の可能性のある患者の予備スクリーニングだけでなく、精神科医の研修生や学生の研修にも活用でき、正式に学科のインターンシップに入る前に指導と支援を提供します。専門の精神科医が担うメンターの役割は、大規模モデルベースの精神科医エージェントにとって実現可能な最適化アプローチを提供します。

「うつ病診断対話シミュレーション:三次記憶を持つ自己改善精神科医」と題された関連研究がプレプリントとして公開されています。

研究のハイライト:

  • 患者エージェントと精神科医エージェント間の診断会話をシミュレートする新しい対話エージェント シミュレーション システムが開発され、研修中の精神科医のトレーニングやうつ病の可能性のある患者の初期スクリーニングに効果的な新しい方法を提供します。
  • 私たちは、診断フェーズでのエージェントの要約スキルを強化し、うつ病の診断と対話シミュレーションにおける将来の最適化の新たな方向性を示す、革新的な 3 層メモリ構造とメモリ検索モジュールを提案します。
  • AMC システムはうつ病の診断と自殺予測の点で改善されており、そのフレームワークは他の特定の分野にも適用でき、限られたラベル付きケースでのトレーニングに適しています。

論文の宛先:
https://arxiv.org/abs/2409.15084

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。

https://github.com/hyperai/awesome-ai4s

D4 データセットは専門の医師によって検証されています。

D4データセットは、呉孟岳教授のチームによって収集され、専門の医師による品質検証を受けています。対話データセットの収集は、以下の3つの段階を経て行われました。

  • 実際にうつ病の可能性がある患者の個人プロファイルを収集し、構築するために、ソーシャルメディアやその他のプラットフォームでアンケートを配布しました。
  • 模擬患者と模擬医師を募集して訓練し、収集したうつ病患者のプロファイルを模擬患者に提供し、模擬医師と模擬患者にうつ病の診察を行わせます。
  • 収集された模擬対話は専門の精神科医に引き渡され、対話の質が検証され、品質テストに合格した対話はうつ病の重症度の診断や症状の要約に使用されました。

D4データセットを収集する3つの段階

呉孟岳教授率いるチームは、収集と検証を経て、合計1,339件の高品質な対話を収集し、うつ病診断のためのD4データセットを構築しました。うつ病の重症度は、無(430対話)、軽度(342対話)、中等度(368対話)、重度(199対話)の4つのカテゴリーに分類され、平均対話回数は21.6回でした。その後、呉孟岳教授率いるチームは、SEOに基づくうつ病症状診断アノテーションフレームワークを提案し、D4データセットにアノテーションを付与しました。

革新的な3層メモリ構造とメモリ検索モジュール

研究者らは、3層のメモリストレージ構造と新しいメモリ検索メカニズムを備えた、3つのモジュールで構成される自動化された大規模対話エージェントシミュレーションシステムを提案した。
患者エージェント:患者エージェントは、D4ユーザープロファイルとうつ病相談対話から抽出されたユーザー情報を使用して初期化されます。AMCはD4から100件の典型的な症例をトレーニングセットとして選択し、GPT-4を用いて相談対話からイベント情報を抽出し、患者の初期記憶ノードとして使用しました。

精神科医エージェントは、初期設定に ICD-11 のうつ病の説明と診断基準を使用し、診断が進むにつれて患者の電子医療記録と要約された診断スキルを蓄積します。

スーパーバイザー プラグイン:精神科医エージェントによる患者エージェントの診断結果を比較し、精神科医エージェントが保存するための経験を要約するために使用されます。

AMCシステムの概要

AMC システム全体の操作プロセスは図に示されており、6 つのステップで構成されています。

  1. D4データに基づいてGPT-4が生成した患者プロファイルを用いて、患者エージェントのバッチが初期化された。患者相談プロセスにおいて、うつ病の診断は患者エージェントに提供されなかった。2. 患者エージェントと精神科医エージェントは、うつ病に関する相談チャットを実施した。
  2. 2 番目のステップでは、インストラクター プラグインは会話の進行中に患者が述べた症状を追跡し、精神科医エージェントに会話の次のステップの提案を提供します。
  3. 相談対話が終了した後、インストラクタープラグインは、精神科医エージェントによる患者の最終診断と、D4 に保存されている実際の医師の診断を比較します。5. 診断結果の比較に基づいて、インストラクタープラグインは、精神科医エージェントに提供されたガイダンスを要約し、精神科医エージェントに提供します。
  4. 1 回の診察を終えると、精神科医は次の患者の代理人を診断のために呼び、このプロセスが繰り返されます。

AMCシステムの運用プロセス

対話と診断を処理するための適応記憶をより効率的に呼び出すために、研究者らは、対話履歴、電子医療記録、要約スキルという3層構造のエージェント記憶アーキテクチャを構築しました。これらの中には、

  • 診断履歴は、現在の対話の履歴記録です。
  • 電子医療記録は、患者の主な訴え、症状、およびその他の事象関連情報を含む、各患者の診察後に精神科医がまとめた会話の要約です。
  • 診断スキルは、インストラクタープラグインによって提供され、精神科医エージェントのメモリに保存されるガイダンスの要約です。これらの要約は、対話プロセスを最適化し、診断の精度を向上させるのに役立ちます。

AMCの3層メモリアーキテクチャ

実験的結論: うつ病および自殺傾向の診断精度が向上します。

AMC の有効性を評価するために、研究者らは D4 テスト セットで 2 セットの実験を実施しました。

まず、D4のオリジナル対話を精神科医エージェントと患者エージェント間の診断対話として用い、モデルの診断能力を検証します。次に、精神科医エージェントと患者エージェント間の対話を用いて、エージェントのロールプレイング能力と診断能力を包括的に評価します。

研究者らは、うつ病と自殺傾向(カテゴリー:なし、軽度、中等度、重度)の診断精度を個別に計算しました。階層的記憶構造を導入した場合と導入しない場合のAMCシステムを比較した結果、テストセットにおけるモデルのパフォーマンスが全体的に向上し、階層的記憶構造の活用におけるAMCの有効性が検証されました。これは、簡易診断と対話型診断の両方において改善が見られました。

うつ病の診断における実験結果

3層メモリ構造の有効性をさらに検証するため、研究者らはアブレーション実験を実施しました。電子カルテの記憶と要約スキルに加え、モデルの精度は着実に向上し、3層メモリ構造の有効性が実証されました。

3層メモリ構造のアブレーション実験結果

インストラクタープラグインの有効性を検証するため、研究者らはプラグインのアブレーション実験も実施しました。実験の結果、インストラクタープラグインはAMCシステムのアーキテクチャをある程度改善することが示されました。

インストラクタープラグインのアブレーションテスト結果

音の謎を探る

近年、AIは音声による呼吸器疾患や消化器疾患の検出など、様々な疾患の診断と治療において強力な能力を発揮しています。しかし、精神疾患の診断と治療は、質の高い関連データの不足により進展が遅れています。これは、精神疾患の患者の多くが依然として偏見を抱えていること、また関連する医療記録が患者のプライバシーに関わることから、AIモデルの学習に必要な大規模データセットの作成が困難であるためです。

呉孟悦の研究グループは、計算精神医学と音声理解における病的な発話の研究に重点を置いています。前述の研究で使用されたD4データセットは、臨床基準を満たす世界初のオープンソースのうつ病相談対話データセットであり、彼女のチームによって構築されており、関連研究の確固たる基盤となっています。

呉孟岳教授は、心理音響学研究の専門知識を持つ非常に豊かな経歴を持ち、AIとメンタルヘルス研究の融合に尽力していることは特筆に値します。HyperAIは呉孟岳教授に詳細なインタビューを実施しました。レポート全文はこちらをクリックしてください:上海交通大学の呉孟岳教授:音声知能技術を用いて精神疾患の初の診断を下す。

本研究論文の筆頭著者は、上海交通大学電子情報・電気工学学院コンピュータサイエンス科の博士課程学生である藍坤姚氏です。上海交通大学で情報セキュリティの学士号を取得し、主な研究分野は精神疾患の診断と治療のための対話システムです。2023年の数理医療技術・応用イノベーションコンテストで2位、第13回全国大学生情報セキュリティコンテストで1位を獲得しました。

ラン・クンヤオ、上海交通大学電子情報電気工学部コンピュータサイエンス学科博士課程学生

彼らの研究グループが所属する上海交通大学のX-LANCEラボは、正式には上海交通大学クロスメディア言語インテリジェンスラボと呼ばれています。 2012年に設立され、以前はインテリジェント音声ラボ(SpeechLab)として知られていました。長年の開発を経て、視聴覚およびテキスト言語情報処理のあらゆるコア研究分野を網羅する「クロスモーダル言語インテリジェンスラボ」へと成長しました。

研究所12周年記念集合写真

現在、クロスメディア言語インテリジェンスラボには、教授 1 名、准教授 4 名、研究助手 1 名が所属し、ACM、AI、IEEE、電気工学、コンピューターサイエンス プログラム、パリ工学院、ミシガン大学・上海交通大学連合研究所から博士課程学生 20 名以上、修士課程学生 30 名以上、学部生 30 名以上が参加しています。

当研究所は、中国国家重点研究開発計画や中国国家自然科学基金優秀若手科学者基金など、数多くの国家プロジェクトおよび企業プロジェクトから支援を受けています。また、AISpeech Technology Co., Ltd.と緊密な連携関係を築き、「上海交通大学AISpeechインテリジェントヒューマンコンピュータインタラクション共同研究室」を設立しました。豊富なデータリソースと、数百基のH800、A800、A10 GPUといった高度なコンピューティングリソースを活用でき、大規模かつ産業グレードのデータ分析・研究を実施できる世界でも数少ないAI研究室の一つとなっています。

心理学のバックグラウンドを持つ学生や計算メンタルヘルスに興味のある方は、ぜひこの研究に参加してください。
研究室ホームページ:

https://x-lance.github.io/zh/