618ZXW

清華大学のチームは、AI ベースのモデル ROAM を提案し、上級病理学者レベルの専門知識を達成して神経膠腫の正確な診断を可能にしました。

神経膠腫は脳内のグリア細胞に由来する腫瘍であり、原発性中枢神経系腫瘍全体の40~60%を占め、成人における最も一般的な原発性頭蓋内腫瘍として知られています。神経膠腫の組織病理学的分類は非常に複雑で、一般的に星状細胞腫、乏突起膠腫、上衣腫の3つのサブタイプに分類され、それぞれがさらに複数のグレードに分類されます。したがって、神経膠腫の予後評価と治療計画には、正確な分類とグレード判定が不可欠です。

神経膠腫の診断は通常、経験豊富な病理医が組織切片を検査することで行われます。しかし、この方法には、病理医の不足、診断の主観性、診断プロセスの長時間化といった課題があり、現在の神経膠腫の診断ニーズを満たすことは困難です。

デジタル病理学と機械学習の近年の進歩により、組織学的スライドのデジタル化が可能になり、豊富な文脈データを含むギガピクセルのスライス全体画像(WSI)に変換できるようになりました。これは、診断、予後、そして分子生物学的特性解析における大きな可能性を秘めています。しかしながら、これらの手法は病理医が選択した病理画像内の関心領域(ROI)のみを解析するものであり、スライド全体の解析を自動化することはできません。

このような背景から、清華大学自動化学科基本生命モデル研究室の呂海栄准研究員、江睿教授、張学功教授は、中南大学湘雅病院の胡忠良教授と共同で、大規模関心領域とピラミッドトランスフォーマーに基づく精密病理診断AI基本モデルROAMを提案しました。このモデルは、神経膠腫の臨床レベルの診断と分子マーカー発見に利用されており、他の種類の腫瘍の病理診断にも拡張可能です。

関連する研究結果は、「神経膠腫の臨床グレードの診断と分子マーカー発見のためのトランスフォーマーベースの弱教師付き計算病理学手法」というタイトルで Nature Machine Intelligence に掲載されました。

ROAMは病理画像から豊富なマルチスケール情報を効果的に抽出し、神経膠腫の腫瘍検出、サブタイプ分類/グレーディング、分子特徴予測など、様々な分類タスクにおける正確な診断を可能にします。ROAMは優れた診断性能を発揮し、病理医の経験に基づいた主要な形態学的特徴を自動的に捉えることで、神経膠腫の正確で信頼性が高く、適応性の高い臨床グレードの診断を提供します。

さらに、ROAMは独立した外部データにも一般化可能であり、優れた一般化能力を発揮します。ROAMは診断の可視化と解釈を通じて、病理医がモデルの診断根拠の信頼性を検証し、貴重な情報を抽出し、補助診断を容易にし、医療水準の向上に貢献します。最も重要なのは、ROAMが分子および形態学的バイオマーカーの発見に役立ち、神経膠腫の診断と治療に新たな知見をもたらすことです。

研究のハイライト:

  • ROAM は、大規模な画像パッチとマルチスケールの特徴学習モジュールを通じて、全切片の組織病理学的画像から視覚表現を効率的に抽出します。
  • ROAM は独立した外部データに一般化することができ、優れた一般化能力を持っています。
  • ROAM は分子および形態学的バイオマーカーの発見に役立ち、神経膠腫の診断と治療に新たな知見をもたらします。

論文の宛先:
https://www.nature.com/articles/s42256-024-00868-w

データセットのダウンロード:

https://go.hyper.ai/r7CyI

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。

https://github.com/hyperai/awesome-ai4s

データセット: 2つの主要なデジタル組織病理スライドデータセット

この研究では、神経膠腫の研究のために 2 つの大規模なデジタル組織病理切片 (WSI) データセットを収集しました。

1. Xiangya 神経膠腫 WSI データセット

このデータセットは、中南大学湘雅病院の神経膠腫スライドから取得されました。下図に示すように、同数の異なる症例から得られた1,109枚のWSIが含まれており、すべて40倍に拡大されています。神経膠腫の検出、サブタイプ分類、グレード分類、分子特性予測といった診断タスクをカバーしており、各症例から収集されたスライドの数も同じです。

Xiangya神経膠腫WSIデータセットの情報

このデータセットには、530例の星状細胞腫、224例の乏突起膠腫、213例の脳室上衣腫のサブタイプとグレードを示すスライスレベルのアノテーションのみが含まれています。さらに、IDH変異症例634例とMGMTプロモーターメチル化症例641例について分子生物学的検査を実施しました。

データセットはランダムに2つの部分に分割されました。1つはモデル学習用の736個のWSIを含む内部学習データセット、もう1つはモデル評価および医師関連の実験用の373個のWSIを含む内部テストデータセットです。両データセットのクラス比は、データセット全体と同じでした。

2. TCGAグリオーマWSIデータセット

神経膠腫に関するもう一つの組織病理学的WSIデータセットは、低悪性度神経膠腫および神経膠芽腫に関するプロジェクトから得られたものです。このデータセットには、神経膠芽腫切片860枚(症例389)と低悪性度神経膠腫切片844枚(症例491)が含まれています。診断基準はXiangyaデータセットで使用されているものとは異なるため、切片レベルのアノテーションのみが保持されました。Xiangyaデータセットのアノテーション作成に参加した2名の病理医が、2016年版診断ガイドラインに従ってこれらの切片の診断結果をレビューおよび改訂するよう依頼されました。

最終的に承認されたデータセットは、倍率40倍および20倍の618個のWSIで構成され、Xiangyaデータセットと一致する4つのタスクをカバーしています。このデータセットは、神経膠腫のサブタイプ分類、悪性度判定、および分子特性予測のための外部テストデータセットとして機能します。

モデルアーキテクチャ: 大面積の関心とピラミッドトランスフォーマーに基づく

ROAM は、マルチインスタンス学習を基本フレームワークとし、大規模な組織画像パッチを基礎研究単位とする弱教師付き計算病理学手法であり、ピラミッド トランスフォーマーを使用して各組織パッチのスケール内およびスケール間の相関特性を体系的に学習し、組織スライス画像全体の視覚表現を効果的に抽出します。

まず、 ROAM は各スライス画像全体に対して組織セグメンテーションを実行し、以下の WSI パッチング図に示すように、後続の分析の基本単位、つまり ROI として大きなサイズの組織画像パッチ (2048×2048) を抽出します。

ROAM基本フレームワーク

次に、各ROIを2回連続してダウンサンプリングし、倍率の異なる3枚の画像を生成します。各画像は小さな画像パッチに分割され、事前学習済みの畳み込みニューラルネットワークによってエンコードされ、それぞれの視覚的表現が抽出されます。これらの表現は、図bの左側のインスタンス特徴抽出に示すように、MILモデルへの入力として機能します。インスタンスレベルの表現は、マルチスケール自己注意(SA)モジュールと注意ネットワークを用いて生成され、この情報はスライスレベルの表現に集約されます。図bの右側のマルチスケール特徴抽出に示すように。

インスタンス特徴抽出とマルチスケール特徴抽出

最後に、図c(インスタンス特徴集約)に示すように、2種類のSAモジュールはピラミッド型変換アーキテクチャを用いて、高倍率から低倍率までマルチスケール特徴を段階的に融合し、組織パッチのマルチスケール視覚表現を取得します。スケール内SAモジュールとスケール間SAモジュールは、それぞれROI内のスケール内およびスケール間に関連する特徴を学習します。どちらのモジュールも、複数のマルチヘッドSAレイヤーとフィードフォワードレイヤーを備えています。

インスタンス機能の集約

研究結果:ROAMが神経膠腫の正確な診断を可能にする

ROAM は神経膠腫の正確な診断を可能にします。

研究者は、内部データセットと TCGA 外部データセットで ROAM の分類パフォーマンスを評価しました。

図aに示すように、ROAMは、内部データセットにおける神経膠腫診断に関連するすべてのタスクにおいて、CLAM、TransMIL、GTP、TEA-graph、H(2)MILを含む5つの手法よりも優れた性能を示しました。3種類の神経膠腫(正常、グリア過形成、腫瘍)の検出において、ROAMの1対1 ROC曲線下面積(AUC)のマクロ平均は0.990 ± 0.002でした。

神経膠腫の分類

神経膠腫の 3 つのサブタイプである星状細胞腫、乏突起膠腫、および上衣腫の場合、ROAM の AUC は、下の図 b に示すように 0.950 ± 0.003 でした。

星細胞腫の悪性度

これらの神経膠腫診断タスクでは、ROAM はすべてのベースライン方法の中で最も高い AUC を達成し、神経膠腫診断における ROAM モデルの有効性と高いパフォーマンスを実証しました。

さらに、 ROAMは優れた汎化能力も示しており、内部データセットのみを用いて学習し、外部TCGAデータセットでテストした場合でも、ROAMの全体的なパフォーマンスは他のベースライン手法を上回っています。さらに、 ROAM予測の可視化結果は、この手法によって要約された診断基準が臨床診断基準と非常によく一致していることを示しています。

ROAM は神経膠腫の臨床補助診断を大きく進歩させました。

研究者らは、ROAMの包括的な臨床レベルの評価を実施し、神経膠腫の補助診断におけるその性能を調査した。本研究には、5名の病理医からなる3つのグループが参加した。1つのグループは臨床経験5年未満の若手病理医、2つのグループは臨床経験5~15年の中級病理医、残りの2つのグループは臨床経験15年以上の上級病理医で構成されていた。

下図に示すように、提案システムは神経膠腫カスケード診断における5つのタスクにおいて非常に優れた性能を示し、病理医5人中4人を上回り、最優秀の上級病理医(Senior 1)の結果と同等の成績を達成しました。特に神経膠腫検出においては、新システムは最優秀病理医を含む全ての病理医を21.30%も大幅に上回りました(下図f参照)。

人間と機械の比較結果

その後、研究者らは3名の初級および中級病理医にROAMの支援下で診断を実施し、診断能力の向上の有無を調査しました。その結果、ROAMの支援により、3名の病理医の診断精度は全タスクにおいて平均7.27%(初級1)、12.87%(中級1)、9.96%(中級2)向上し、ROAMの臨床的価値の高さが示されました。

ROAM は神経膠腫の分子形態学的マーカーの発見を促進しました。

研究者らはROAMを用いて、神経膠腫の診断に関連する主要な分子特性の形態学的発現を調査したところ、ROAMはイソクエン酸脱水素酵素(IDH)変異の分子特性の予測において非常に優れた性能を示したことが分かりました。研究者らは、このタスクにおけるROAMの予測結果の完全な可視化解析を行い、ROAMによって特定された注目度の高い主要領域の組織形態学的特性を分析・要約しました。その結果、IDH変異の病理画像では、好酸球増多、均質な細胞質、そして濃染した核が共通して観察されることが分かりました。

びまん性星状細胞腫および乏突起膠腫に基づくこれらの関心領域 (ROI) の視覚化により、IDH 変異を伴う神経膠腫の特有の特徴が明らかになりました。

この重要な発見により、医師は分子検査に頼らずにIDHの状態を予備的に予測できるようになり、神経膠腫の臨床診断基準の前進と最適化および改善に重要な役割を果たします。

清華大学オートメーション学部生命科学基礎モデリング研究室は、AI を活用した生命科学研究を継続的に推進しています。

本論文では、中南大学湘雅病院の呂海栄准研究員、張学功教授、胡忠良教授が責任著者です。清華大学の江睿教授と修士課程の殷暁旭、中国移動研究所の楊鵬帥、湘雅病院の程玲超が共同筆頭著者です。胡俊、楊嬌、王英、傅暁丹、尚立、李立玲、林偉、周歓は本研究のデータ収集とアノテーションに協力しました。陳富鋒と福州データ技術研究所はオンラインソフトウェアプラットフォームの研究開発支援を行いました。

この研究の主な貢献者の 1 つである清華大学オートメーション学部基礎生命モデル研究室は、高度な人工知能テクノロジーを活用して生命科学研究を強化する方法の探求に常に取り組んでいます。

今年6月、清華大学自動化学科基礎生命モデリング研究室長の張雪功教授、電子工学科/AIRの馬建柱教授、生命科学科の宋楽博士は共同で、大規模細胞モデル「scFoundation」を構築しました。このモデルは5,000万個の細胞の遺伝子発現データを用いて学習され、1億個のパラメータを有し、約2万個の遺伝子を同時に処理することができます。基礎モデルとして、仮想薬物試験など、様々な下流バイオメディカルタスクにおいて大幅な性能向上を示し、単一細胞研究における人工知能の新たなパラダイムを提供しました。

「単一細胞トランスクリプトミクスにおける大規模基礎モデル」と題された研究成果は、Nature Methods誌に掲載されました。全文はこちらをクリックしてください:「1億パラメータの大規模細胞モデルが登場!清華大学のチームがNatureのサブジャーナルに掲載されたscFoundation:2万遺伝子の同時モデリング」

scFoundationモデルと下流のアプリケーションシナリオ

scFoundationモデルは、生命科学の基礎研究、細胞摂動応答の予測、創薬ターゲットの発見に革新的な方法論とツールを提供します。また、モデルアーキテクチャ、トレーニングフレームワーク、下流のデモンストレーションアプリケーションシステムの面で、大規模細胞モデル研究のための新たなアイデアと手法を提供します。scFoundationモデルは、単一細胞分野における基本モデルの限界を拡大することに成功し、数値基底空間における仮想薬物実験などの将来の研究の基盤を築きました。

清華大学オートメーション学科生命科学基盤モデリング研究室は、将来を見据え、人工知能と生命科学の交差点における研究を継続していきます。AI技術の継続的な発展と改善により、生命科学分野への応用は医療技術の進歩を大きく促進し、診断と治療の精度を向上させ、医療費を削減し、最終的には人々の健康と生活の質を向上させるでしょう。

参考文献:
1.https://www.nature.com/articles/s42256-024-00868-w

2.https://mp.weixin.qq.com/s/oB3kTgcgObawPKU-75KsHQ

3.https://mp.weixin.qq.com/s/nflI4PVTJB3xVPXuA5zbZQ

召喚命令

HyperAI(hyper.ai)は、データサイエンス分野における中国最大の検索エンジンであり、AI for Scienceの最新の研究成果に焦点を当て、トップジャーナルの100以上の学術論文を解釈しています。

AI for Science について研究を行っている研究グループやチームの皆様は、ぜひ私たちにご連絡いただき、最新の研究成果を共有したり、詳細な記事を投稿したり、Meet AI4S のライブ ブロードキャストに参加したり、AI4S を一緒に推進するためのさまざまな方法を模索したりしてください。

WeChatを追加: PH (WeChat ID: G18539589505)