618ZXW

時系列予測の「ブラックボックス」問題を解明!華中科技大学は、患者の生存率の主要指標を明らかにするためにCGS-Maskを提案しています。

AI技術が日常生活に広く応用されるにつれ、モデルの「解釈可能性」は徐々に解決すべき喫緊の課題となってきました。特に人命や財産の安全に関わるタスクにおいては、この「ブラックボックス」アルゴリズムは、ユーザーのAIシステムへの信頼を弱めるだけでなく、安全性や識別性といった一連の問題を引き起こします。

この問題は、時系列予測タスクにおいて特に顕著です。時系列予測は、株式市場予測、疾病予測、エネルギー予測、天気予報など、複数の主要産業に関わっています。これらの分野では、AIの意思決定の背後にある理由を理解することが不可欠です。疾病予測を例に挙げると、医師と患者はAIの予測だけでなく、その結果がどのように導き出されたのかを知る必要があります。診断において重要な役割を果たす症状を明確に特定することで、医師と患者のAI支援による医療診断への信頼を高めることができます。

時系列予測を単なる正確な数値ではなく「目に見える」プロセスにするために、華中科技大学の陸鋒氏のチームは、シドニー大学および同済病院のゾマヤ院長のチームと共同で、新しい手法であるCGS-Maskを提案しました。時系列予測と解釈可能性を組み合わせることで、この手法はモデル予測の精度を向上させると同時に、予測結果をより直感的で解釈しやすいものにすることができます。

具体的には、マスキングメカニズムを導入することで、モデルは最終結果に最も大きな影響を与える瞬間とデータを強調表示できます。これは、運転中に重要な道路標識を明確に表示し、特定の方向転換や減速の判断が必要な理由を理解するのに役立つのと同様です。この手法は、ヘルスケア、天文学、センサー、エネルギーなどの分野で幅広い応用が可能であり、特にユーザーインタラクションを必要とする時系列予測タスクにおいて重要です。

「CGS-Mask: 時系列予測を誰にとっても直感的に」と題されたこの研究結果は、トップクラスの国際人工知能会議である第38回AAAI人工知能会議(AAAI'24)の議事録での発表が承認されました。

研究のハイライト:

  • CGS-Mask は、従来の方法と比較して、予測結果にとってどの期間が最も重要で、どの要素が重要でないのかをより明確に示し、ユーザーが予測プロセスを理解しやすくします。
  • CGS-Mask は、さまざまな時系列予測タスク、特に株式市場予測、病気予測、天気予報など、ユーザーの操作と結果の解釈が必要なシナリオに適しています。
  • CGS-Maskは、精度、解釈可能性、直感性において他の手法を凌駕し、「ブラックボックス」問題を軽減し、モデルの透明性を高めます。この手法により、専門家でなくてもモデルの予測を理解できるため、ユーザーフレンドリーとなり、モデルの適用性と信頼性が向上します。
  • 今後、研究者らはCGS-Maskを積極的に強化し、この手法を用いて医療記録から顕著な特徴を識別し、病気の発生、進行、悪化を明らかにするなど、特にヘルスケア分野において、より多くの時系列アプリケーションへの適用可能性を実証することを目指します。

論文の宛先:
https://ojs.aaai.org/index.php/AAAI/article/view/29325

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。
https://github.com/hyperai/awesome-ai4s

データセット: ヘルスケア、天文学、センサー、エネルギーを網羅した合成データ + 実世界のデータ。

研究者らは、「まれな特徴」、「まれな時間」、「混合」、「ランダム」という 4 つの合成データセットを選択しました

  • 希少な特徴データセットと希少な時間データセットには、それぞれ、顕著な特徴の小さなサブセットと、顕著な時点の小さなサブセットが含まれています。
  • 混合データセットは、まれな特徴とまれな時間を統合して作成されました。
  • ランダム データセットの顕著な入力領域はランダムに配置されます。

研究者たちは、MIMIC-III、LSST、NATOPS、AEといった実世界のデータセットを選択しました。これらのデータセットは、医療、天文学、センサー、エネルギーなどの分野を網羅しており、CGS-Maskの様々な分野における性能評価に使用されました。

MIMIC-IIIデータセットには、集中治療室(ICU)の患者4万人分の医療記録が含まれており、それぞれ31の特徴量に基づいて、今後48時間の患者の生存率を予測します。これは、患者が生存するか死亡するかを区別することを目的とした二値分類タスクです。

LSSTデータセットは、大型シノプティックサーベイ望遠鏡(LSST)による観測のために作成された、模擬天文時系列データセットです。予測モデルでは、このデータを14の異なる天文カテゴリに分類する必要があります。

ジェスチャー認識センサーによって生成されたNATOPSデータセットは、手、肘、手首、親指からのセンサーデータを記録します。このデータは6つの異なるジェスチャーに分類する必要があります。

AEデータセットは、UCIリポジトリの家電製品のエネルギー予測データセットであり、家庭内の総エネルギー使用量を予測するために使用されます。これは回帰タスクであり、予測モデルの出力は総エネルギー使用量を表す数値です。

モデル アーキテクチャ: 最適化されたバーコードである CGS-Mask は、時系列予測の明確で直感的な解釈を提供します。

CGS-Maskは、細胞遺伝学的ストリップマスクに基づくサリエンシー手法です。細胞遺伝学的アルゴリズムを組み合わせてストリップマスクを最適化することで、時系列予測タスクにおける「ブラックボックス」問題を解決し、モデルの解釈可能性を向上させます。

  • バーマスクは、連続する時間ステップを全体として処理することで特徴の影響を評価し、時系列データの時間的な依存性を効果的に捉えます。バーマスクのバイナリ値(0 または 1)により、結果の解釈可能性が向上し、有意性スコアリングがより直感的になります。

バーコードを最適化する具体的な手順は以下のとおりです。まず、バーコードセットを作成し、それらをセルオートマトンにマッピングします。次に、遺伝的操作(交叉、突然変異、翻訳など)を用いて各マスクを最適化し、次の世代へと進化させます。N世代後、最も高い適応度を持つマスクを最適なマスクとして選択します。CGS -Maskの全体的なフレームワークを下図に示します。

CGSマスクの全体構成図

集団の初期化: バーコードの集団をランダムに初期化し、これらのマスクを 2 次元セルオートマトンにマッピングします。

適合性評価: 各バーマスクの適合性値を計算し、定義された摂動誤差を使用して評価します。これにより、マスクがモデルの予測に与える影響を測定します。

遺伝的演算子の最適化: 交差、突然変異、翻訳などの遺伝的演算子を使用して、各マスクを最適化します。

  • 交叉:このアルゴリズムは、隣接するマスク間で交叉演算を実行し、新しいマスクを生成します。CGS-Maskでは、ストライプが遺伝的操作の基本単位です。新しいマスクのストライプは、どちらの親からでも継承できます。
  • 突然変異: マスク内のストライプを一定の確率で置き換えることで遺伝的多様性を高め、アルゴリズムが早期に局所最適値に収束するのを防ぎます。
  • 翻訳: タイムライン上のバーの位置オフセットを調整して、バーマスクを最適化します。これにより、バーの位置を微調整し、入力データの真の顕著な領域とより正確に一致させることができます。

反復進化: 上記の遺伝的演算子を繰り返し適用することにより、集団内のマスクは継続的に進化し、より高い適合値を持つマスクを見つけます。

最適なマスクの選択: N 回の反復後、最も高い適合値を持つマスクが最適なマスク (最適マスク M*) として選択されます。

CGS-Maskは、セルオートマトンと遺伝的アルゴリズムを組み合わせることでバーコードを効果的に最適化し、時系列予測の明確で直感的な解釈を提供します。この手法は内部モデル情報を必要としないため、様々なブラックボックスモデルに適しており、ユーザーに意味のある解釈を迅速に提供できます。

実験の結論: CGS-Mask は、時間の経過とともに変化する重要な特徴を効果的に識別し、病気の発症と悪化の重要な要因を明らかにします。

CGS-Mask法の性能を評価するため、研究者らは合成データセットと実世界データセットの両方において、CGS-Mask法を他の8つの最先端の顕著性評価手法と比較しました。これらの手法には、Dynamask、DeepLIFT、RISE、FIT、Shapley値サンプリング(SVS)、特徴オクルージョン(FO)、特徴パーミュテーション(FP)、統合勾配(IG)が含まれます。下図に示すように、実験結果から、CGS-Maskは顕著な特徴の識別において高い精度を示し、時間とともに変化する顕著な特徴をより効果的に識別できることが示されています。

実世界のデータセットの比較結果

ヘルスケア分野での応用を例に挙げ、研究者らはMIMIC-IIIデータセットを用いて、患者の今後48時間の生存率を予測しました。以下の図は、異なる手法の比較を示しています。図fはCGS-Maskの予測結果を示しており、緑色のバーは患者の転帰に関連する主要な特徴を示しています。研究では、血圧の低下、頻脈、息切れはすべて差し迫った死亡リスクを示しており、医師はこれらの特徴に基づいて迅速に介入できることがわかりました。しかし、図(a)~(d)に示すように、他の比較方法では、この転帰につながる期間と特徴を明確に特定できませんでした。

生成されたマスクの可読性を評価するため、研究者らは、年齢層(5歳から83歳まで)と専門知識レベルが異なる254名の参加者を対象に調査を行いました。その結果、 65%以上のユーザーがCGSマスクを、特徴とその時間的関連性を理解するのに最も役立つ手法と評価し、85%以上が上位3つにランクインしました。

さらに、研究者らはパイロットユーザースタディを実施し、3つの顕著性マスク(Q1、Q2、Q3)を用いて10段階にわたって4つの特徴(A、B、C、D)を判定する際の特徴重要度評価の反応時間と精度を評価しました。下の図に示すように、CGS-Mask(Q2)を使用したユーザーの平均反応時間は6.26秒で、精度は85.4%でした。一方、数値マスク(Q1とQ3)を使用したユーザーの平均反応時間は19.22秒で、精度はわずか40.6%でした。これは、CGS-Maskがユーザーが特徴重要度をより迅速かつ正確に特定するのに役立つことを示しています。

ユーザーの応答時間と選択結果

まとめると、モデルに依存しない顕著性評価手法であるCGS-Maskは、直感的でユーザーフレンドリーであるだけでなく、時系列予測を効果的に解釈します。その性能は、合成データと実世界データの両方において、既存のソリューションを凌駕しています。特に医療分野において、CGS-Maskは医療記録における顕著な特徴の特定において卓越した能力を発揮し、疾患の発生、進行、悪化の解明に非常に重要であり、大きな応用可能性を秘めています。

医療分野における時系列予測モデルの最先端の応用

時系列予測は、時系列を持つデータを分析し、モデルを構築することで、データ内の傾向、季節性、周期的なパターンを捉えることを目指します。これらのモデルは、過去のデータの変化を予測するだけでなく、将来の発展傾向を分析することもできます。その応用範囲は非常に広く、金融、気象、医療、交通、エネルギー予測など、複数の分野をカバーしています。

医療分野において、本論文の筆頭著者である華中科技大学の馮陸教授は、シーケンス予測モデルの応用に焦点を当ててきました。上記の研究に加え、彼女はシドニー大学のチームと共同で、「術中低血圧早期警告のための複合マルチアテンションフレームワーク」と題する論文を第37回AAAI人工知能会議(AAAI'23)の議事録に発表しました。

原著論文:
https://ojs.aaai.org/index.php/AAAI/article/view/26681

本論文では、研究者らが術中低血圧の早期警告のためのマルチモーダルかつ注意に基づくフレームワークを提案しています。2つの大規模な実世界データセットを用いた実験では、この手法が術中低血圧イベントの早期警告において最大94.1%の精度を達成し、必要な信号サンプリングレートを3,000分の1に大幅に削減できることが実証されています。さらに、最も困難な15分間平均血圧予測タスクにおいて、このマルチモーダルフレームワークは平均絶対誤差4.48mmHgを達成し、既存のソリューションと比較して42.9%の削減を実現しました。

同様に、南京医科大学の研究チームは、肝炎の発生率を予測するための時系列モデルを開発しました。季節自己回帰移動平均モデルと季節指数平滑化モデルを用いて、様々なタイプの肝炎の症例数を分析しました。

研究によると、3月は各種肝炎の流行期であることが分かっています。過去10年間、A型肝炎の発生率は概ね減少傾向にありますが、B型肝炎の発生率は変動しており、近年増加傾向にあります。C型肝炎の発生率は引き続き上昇傾向にありますが、E型肝炎の発生率は比較的安定しています。これらの知見は、より効果的な肝炎予防・抑制対策の開発に向けた重要なエビデンスとなります。「2012年から2021年までの中国における4つの肝炎流行傾向の時系列分析と予測」と題されたこの研究は、南京医科大学(自然科学)誌に掲載されました。

結論として、時系列予測技術は医療分野において大きな可能性を示しています。技術の継続的な進歩とデータの増大に伴い、今後、より革新的な時系列予測モデルと手法が開発され、人々の健康と福祉にさらに貢献していくことを期待しています。

参考文献:
https://mp.weixin.qq.com/s/8gYtFqcuctY0BqBYa1e_Hg