618ZXW

オーストラリアのチームがディープラーニングと頭蓋骨CTスキャンをベースに開発した新たな成果により、人間の法医学専門家を凌駕し、97%の精度で性別を判定することが可能になった。

近年、サスペンスや犯罪を題材にした映画やテレビドラマのヒットにより、ある謎めいた学問が人々の注目を集めています。それが法医学です。一言で言えば、法医学はシャーロック・ホームズのように、影に潜みながら真実を追い求める存在です。専門知識と高度な技術を駆使し、遺体や物証に秘められた沈黙の証言を読み解き、数々の難事件の手がかりを掴み、捜査の方向性を示してきました。法医学は司法の公正を担保する揺るぎない礎であり、その重要性は言うまでもありません。

多くの法医学研究分野において、遺体の性別判定は極めて重要な側面です。白骨遺体の場合、従来の方法では、経験豊富な法医学者が公表されている基準に基づいて推論・評価を行っていました。しかし、これらの方法は主観的な要素に左右されることが多く、必然的に偏った結果につながります。現在、コンピューター技術やディープラーニング技術の普及に伴い、科学を活用して人間のバイアスの影響を克服することが新たな課題となっています。

最近、西オーストラリア大学、ニューサウスウェールズ大学、インドネシアのハサヌディン大学のチームが、ディープラーニングベースの自動化フレームワークを使用して性別の判断精度を向上させ、認知バイアスの影響を軽減することを提案しました。

この研究では、インドネシアの病院で撮影された頭蓋骨CTスキャン200枚を用いて、3種類のディープラーニングベースのネットワーク構成を学習・テストしました。最も精度の高いディープラーニングフレームワークは、性別と頭蓋骨の特徴を組み合わせて判断し、 97%の分類精度を達成しました。これは、人間の観察者の82%という精度を大幅に上回るものでした。この実験は、法医人類学におけるディープラーニングフレームワークの詳細な応用の可能性を示しています。

「ディープラーニング対人間の評価者:3次元コンピューター断層撮影スキャンによる法医学的性別推定」と題された関連研究結果が、学術誌「Scientific Reports」に掲載された。

論文の宛先:
https://www.nature.com/articles/s41598-024-81718-y

オープンソース プロジェクト「awesome-ai4s」は、200 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。

https://github.com/hyperai/awesome-ai4s

AIをさらに「信頼でき、使える」ものにするために

法医人類学において、骨格構造は、特に頭蓋骨において、性別の特徴における多くの違いを隠蔽します。現代の法医学において、性別判定のための最も一般的な形態学的手法の一つは、フィリップ・L・ウォーカーが提唱した5つの頭蓋骨二形性特徴(以下、ウォーカー特徴)です。これは、男性と女性の頭蓋骨におけるオトガイ隆起(MEN)、眉間(GLA)、眼窩上縁(SUP)、項部隆起(NUC)、乳様突起(MAS)の違いを観察するものです。

例えば、この研究では、男性の眉毛は一般的に目立ち幅が広く、目立った隆起や突起があるのに対し、女性の眉毛は滑らかで細いことが示されています。男性の眼窩は、角が鋭く、全体的に角張った印象のものがほとんどですが、女性の眼窩は丸みを帯び、縁は自然で柔らかな曲線を描き、目立った鋭角はありません。

しかし、法医学人類学の発展に伴い、この手法にもいくつかの限界が生まれています。まず、この手法や他の身元確認手法で分析されるデータサンプルはすべて物理的な記録から得られるため、十分なサンプルを得るには膨大な数の骨格が必要になります。また、この手法で使用されるサンプルは、19世紀から20世紀にかけて生きたイギリス人、アメリカ人、そしてネイティブアメリカンの人々から得られるため、研究対象の時間的・空間的妥当性にも一定の限界が生じます。

バーチャル人類学の出現は、法医学人類学の実践に新たな道を開きました。データセットの取得に関しては、ウォーカーの研究で用いられたデータ収集方法とは異なり、コンピュータ断層撮影(CT)などの臨床デジタル画像技術を用いることで、研究者は十分に大規模な骨格データセットを取得することができます。物理的な骨格を収集するよりも、臨床画像診断によって記録されたバーチャル骨格データセットは、間違いなく容易に構築できます。さらに、現代医学においてCTが広く使用されているため、この方法によって得られたデータセットは、現代の集団をよりよく代表するものとなります。

分析と処理の面では、ディープラーニングに基づく技術が法医人類学にも応用されています。研究者たちはディープラーニングを用いて大規模なデータセットを処理し、骨格の性別を判定するためのモデルを構築することで、法医人類学者による生物学的評価を支援しています。例えば、Bewesらが開発したGoogleNetは、頭蓋骨CTスキャンの2D側面画像から3D画像を再構築し、これを用いて骨格の性別を判定することができ、男性では96%、女性では94%の精度を達成しています。

これらの方法は大きく進歩したとはいえ、これまでのディープラーニング ベースの骨格による性別識別方法には、完全な自動化と解釈可能性という課題がまだ残っていることは注目に値します。

まず、一部の研究では、市販のソフトウェアを用いて周囲の構造を除去し、ハウンスフィールド単位(HU)閾値を経験値に基づいて設定することで頭蓋骨を抽出しています。これは、ソフトウェアのアクセシビリティ、ノイズ、アーティファクト、不要な骨格構造、HU値の変動といった問題の影響を受ける可能性があります。

第二に、頭蓋骨の特徴を識別する人間の観察者とは異なり、ディープラーニング ベースのネットワークは、隠れた層の構造化が通常困難であり、それがディープラーニング ベースのネットワークの解釈可能性を制限するため、「ブラック ボックス」と呼ばれることがよくあります。

複数の設計機能により、人間の能力を超える AI フレームワークが作成されます。

この研究では、研究者らは、法医学的性別判定に頭蓋CTスキャンを使用する完全に自動化されたAIフレームワークを開発し、ウォーカー氏が提案した特徴を使用してモデルを検証しました。

このAIフレームワークは、前処理段階と性別分類ネットワークで構成されています。まず、事前学習済みのディープラーニングネットワークを用いて頭蓋骨のセグメンテーションを行います。次に、入力構成を変えて、異なる分類ネットワーク構成を学習します。性別識別のためのウォーカー特徴量を生成するためにマルチタスク学習を使用し、性別識別にはシングルタスク学習を使用します。具体的なネットワーク設定は下図に示されています。

ディープラーニングベースのネットワーク構成と関連出力

* I は前処理されたCT画像を表します。

* (I, S) は、前処理済みの CT 画像と頭蓋骨マスクを含むデュアル チャネル入力を表します。

* I∩Sは単一の頭蓋領域を表します。

* N1 と N2 は結合損失関数を使用し、N3 はバイナリクロスエントロピー損失関数を使用します。

ResNet上に、N1、N2、N3の3つのディープラーニングネットワークバリアントが構築されています。ResNetは、1つの入力ブロックと3つの残差ブロックで構成され、それぞれ3D畳み込み層(Conv3D)、バッチ正規化層(BNU)、およびReLU(ReLU)活性化層で構成されています。入力ブロックには32個のフィルターが含まれ、残差ブロックにはそれぞれ64個、128個、256個のフィルターが含まれます。Conv3Dカーネルのサイズは3 x 3 x 3です。下の図をご覧ください。

ResNetバックボーン

ResNetバックボーンから構築された3つのネットワークアーキテクチャバリアントN1、N2、N3

すべてのネットワークは、Python v3.9 を使用して Torch 2.0 で実装され、16 GB の RAM を搭載した NVIDIA Tesla P100 GPU でトレーニングされました。

本研究で使用したデータセットは、インドネシアのワヒディン・スディロフソド総合病院(RSWS)から提供されたものです。このデータセットは主に、2020年1月から2022年8月の間に同病院で放射線検査を受けた患者の一部を対象としたマルチシルセクトCT(MSCT)スキャン画像(合計200枚)で構成されており、そのうち87枚が女性、113枚が男性でした。データセットから166枚の画像が学習に、34枚の画像がテストに使用されました。

具体的には、3つのネットワークアーキテクチャのうち、N2のマルチタスク構成(異なるブランチでウォーカーの頭蓋骨の形態学的特徴スコアと性別を推定)は、異なる入力条件下において最高のAUROCと精度を達成し、性別識別において最もバランスの取れたモデルとなりました。頭蓋骨領域を入力として使用した場合、 N2は最高の精度0.97と最低の対数損失0.30を達成しました。

N1 のマルチタスク構成 (ウォーカーの頭蓋骨の形態学的特徴スコアを順に推定し、次に性別を推定する)は、頭蓋骨領域を入力として使用した場合に 0.91 の精度を達成しますが、異なる入力での N2 および N3 よりも AUROC が低く、ログ損失が大きくなります。

シングルタスクネットワークN3(性別直接推定)は、異なる入力条件においてN2と同等のAUROC値を示しましたが、頭蓋骨を入力にした場合の精度はわずか0.85で、これは全ネットワークの中で最も低い値です。具体的な結果は以下の図に示されています。

3つのネットワークモデルと人間の観察者のパフォーマンス指標

注目すべきは、人間の観察者と比較した場合、3つのディープラーニングベースのネットワークモデルすべてが性別識別において高い精度を達成したことです。具体的には、 N2モデルは97%という最高の性別識別精度を達成しましたが、人間の観察者では82%にとどまりました。

ネットワークの意思決定プロセスの解釈可能性を向上させるため、研究チームはGrad重み付けクラス活性化マッピング(Grad-CAM)を用いて、ネットワークによって識別された識別可能な頭蓋骨領域を可視化しました。Grad-CAMは、畳み込みニューラルネットワークの決定を解釈するための手法です。その基本的な考え方は、出力クラスの勾配をその層の出力に乗算し、その結果を平均化することで「粗い」ヒートマップを作成することです。このヒートマップは拡大表示でき、元の画像に重ね合わせることで、分類時にモデルが最も重点を置いている領域を示すことができます。Grad-CAMの利点は、構造変更や再学習を必要とせずに、あらゆる畳み込みニューラルネットワークで使用できることです。

下の図は、頭蓋骨を入力として用いたネットワークN1とN2のWalker特徴枝における各特徴予測に関するGrad-CAMヒートマップを示しています。A、B、C、D、EはそれぞれGLA、MAS、MEN、NUC、SUPです。ヒートマップでは特にGLAとNUCが強調されています。

下の図は、頭蓋骨を入力として用いた3つのネットワークのGrad-CAMヒートマップを示しています。GLAの活性化に加えて、頭蓋骨周辺領域、特にN3ヒートマップも活性化されていることがわかります。CT画像は均一な物理的サイズに前処理されているため、モデルは頭蓋骨全体の形態、おそらくサイズと形状を分析している可能性があります。頭蓋骨のサイズと形状は、人間の性的二形性を反映する重要な特徴であり、一般的に男性の頭蓋骨は女性の頭蓋骨よりも大きく重いためです。

要約すると、この実験は、ディープラーニングをベースとした完全自動化AIフレームワークが骨格の性別判定精度を向上させる上で有効であることを実証し、既存の基礎的手法と比較して、その法医学的適用範囲が著しく広いことを示しています。さらに、このフレームワークは人間の観察者を凌駕する可能性を秘めており、法医人類学のよりインテリジェントで自動化された研究を支援する可能性を秘めています。

さらに、Grad-CAMは、頭蓋骨分析による性別判定におけるディープラーニングベースのネットワークモデルの解釈可能性を実証しています。これらの統合により、法医人類学においてより標準化された客観的な評価が可能になり、認知バイアスや変動性の影響を軽減できます。

AIが法医学人類学に新たな章を開く

実際、法医学人類学における性別判定の支援にAIを活用する研究は数多く行われています。偶然にも、Scientific Reportsに掲載された関連論文では、画期的な手法が数多く発表されています。

例えば、「ディープラーニングによる死後コンピューター断層撮影からの頭蓋骨シルエット画像を用いた性別推定」という研究では、ディープラーニングを使用してCTスキャンから2次元のシルエット画像を取得し、頭蓋骨の輪郭形状を強調した後、さまざまな角度からシルエット画像を観察し、多数決を使用して性別を判定しています。

論文の宛先:
https://www.nature.com/articles/s41598-024-74703-y

四川大学コンピュータサイエンス学院と華西基礎医学・法医学学院が共同で開発したディープラーニングベースの頭蓋顔面再構成手法により、CTスキャンの頭蓋骨データから頭蓋顔面画像を自動的に再構成することに成功しました。研究チームは頭蓋顔面再構成における技術的課題を克服し、初の頭蓋顔面再構成顔検索システムを開発しました。このシステムは、単一の頭蓋骨データセットに基づいて、年齢や性別は異なるものの同一人物である顔面を再構成した一連の顔画像を生成することで、年齢や変形が人物認識に与える影響を排除し、精度を向上させます。

「CR-GAN: 個人識別のための自動頭蓋顔面再構成」と題されたこの論文は、パターン認識分野のトップジャーナルである「Pattern Recognition」に掲載されました。

論文の宛先:
https://www.sciencedirect.com/science/article/abs/pii/S0031320321005768

もちろん、骨格構造に基づく性別判定は頭蓋骨だけに限りません。前述のように、骨格構造には男女の違いに関する豊富な情報が含まれています。例えば、骨盤は男女で生理機能が異なるため、性別判定において非常に明確な特徴を示します。これらの特徴に基づき、深層学習を用いた性別判定手法も研究されています。

結論として、AIの広範な導入は、法医人類学における性別識別の問題に対する客観的かつ持続可能な解決策を提供します。また、この神秘的でニッチな分野は、古来の識別方法から脱却し、他の分野と同様に、徐々に知能化と自動化を取り入れていくでしょう。

参考文献:
1.https://www.nature.com/articles/s41598-024-81718-y
2.https://www.csiro.au/en/news/All/News/2025/February/CSIRO-develops-AI-tool-for-rapid-identification-in-forensic-investigations
3.https://blog.csdn.net/qq\_68308828/article/details/132663304
4.https://mp.weixin.qq.com/s/bpZCZMM5MJRShhZvI2fcsw

最後に、学術ライブ配信をおすすめします!3月7日正午より、「Meet AI4S」の最新エピソードは「AI時代の彼女の力:ハードコアテクノロジーによる変革」をテーマに放送されます。華中科技大学の黄紅准教授、上海人工知能研究所AI科学センターの周東展若手研究員、上海交通大学自然科学研究所の周秉馨助手が登壇し、それぞれの研究成果や研究経験について紹介します。