618ZXW

チベット高原のデータ不足問題に取り組みます!浙江大学のチームが、チベット高原の地表熱流の分布を説明する新しいGeoAIモデルを提案しました。

地球科学研究において、地表熱流量(SHF)は、地球深部からの熱エネルギー放出の重要な指標として、常に注目を集めてきました。地表熱流量は、地球内部のエネルギー駆動力を探る「窓」であるだけでなく、地殻の熱構造、マントルの熱力学、そして地質構造の進化を解明するための重要なパラメータでもあります。地表熱流量の研究を通して、地球内部の熱メカニズムをより深く理解し、プレートの沈み込み、マントルの隆起、リフトの拡大といった地質現象の背後にある力学的なプロセスを解明することができます。

過去数十年間に地表熱流の研究は大きく進歩したにもかかわらず、世界中の特定の地域、特にチベット高原のような複雑な地殻変動帯では、多くの謎が未解明のまま残っています。

地球の「第三の極」であるチベット高原は、その広大な地形的差異と複雑な地殻構造により、地球力学を研究するための天然の実験室として機能しています。インドプレートとユーラシアプレートの衝突以来、この地域は激しい地殻変動に見舞われ、多様な地質単位と地熱異常をもたらしました。近年の研究では、チベット高原全体の地表熱流量に顕著な空間的不均一性が明らかになっています。ヤルンツァンポ縫合帯と南北に走るリフトバレーには高い熱流量が集中している一方、他の地域では比較的低い熱流量分布を示しています。しかし、測定点の不足と観測範囲の狭さから、この熱流量分布パターンの定量分析は依然として大きな技術的ボトルネックとなっています。特に起伏が激しく人口密度の低い地域では、従来のボーリング測定法や観測機器を大規模に展開することが困難であり、その結果、これらの地域では地表熱流量データがほぼ完全に欠如しています。

この問題に対処するため、浙江大学地球科学学院は、空間インテリジェントアプローチである、解釈可能性を強化した地理ニューラルネットワーク加重回帰モデル(EI-GNNWR)を提案しました。この手法は、地球物理学的データと地質学的データの空間的不均一性を統合し、地表熱流量の非線形関係を捉えることで、チベット高原の熱流量分布と地球力学的メカニズムを包括的に理解するための新たな研究枠組みと技術的支援を提供します。

「データ駆動型手法で明らかにされたチベット高原の表面熱流の分布」と題された関連研究が、著名な地球科学誌「Journal of Geophysical Research: Solid Earth」に掲載されました。

研究のハイライト:

  • 地質構造情報と地球物理学的データを完全に考慮したデータ駆動型アプローチ、EI-GNNWR モデルが提案されています。
  • EI-GNNWR モデルは、オーストラリアとチベット高原の地表熱流マップを正確に予測し、XGBoost、FCNN、OLR、GWR の 4 つの主要モデルよりも大幅に高い予測精度を実現し、チベット高原地域における地表熱流データの不足を効果的に補いました。
  • EI-GNNWR モデルは、チベット高原の表面熱流の分布とその影響メカニズムを効果的に明らかにします。

論文の宛先:

https://doi.org/10.1029/2023JB028491

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。

https://github.com/hyperai/awesome-ai4s

モデルのトレーニングは、チベット高原および世界各地から収集された地表熱流データセットを使用して実施されました。

研究者らは、地球規模の地表熱流量データセット、NGHF 陸地熱流量データセット、および我が国の青海チベット高原地域における地表熱流量データセットを統合し、海洋測定データと「D: 熱流量マップに使用されないデータ」というラベルの付いたすべての測定データを削除して、初期データセットを形成しました。

中国本土の表面熱流データセットのアドレス:

https://go.hyper.ai/oYfAz

チベット高原における観測データは限られているため、既存の観測は主に高原の縁部に集中しており、内陸部に関する理解は限られています。そこで研究者らは、周囲のプレートからの表面熱流量測定データを取り入れ、データセットを拡張しました。

チベット高原とその周辺マイクロプレートの表面熱流量測定データの分布図

本研究では220箇所の地表熱流測定点を用い、そのうち90%をモデルの学習および検証データセットに、残りの10%をモデルの精度検証のためのテストデータセットに使用しました。実験精度を向上させるため、研究者らはモデルの学習および検証の両段階で相互検証手法を採用しました。

さらに、データが乏しい青海・チベット高原地域における地表熱流量の値を予測するには、これらの値と地球物理学的および地質学的特徴との関係をフィッティングする必要があります。この目的のために、研究者らは地表熱流量に関連するいくつかの重要な特徴を選択しました(下表参照)。

研究で使用された地球物理学的および地質学的特徴データ

GNNWR モデルに基づいて、SHAP 値の計算方法が導入されています。

チベット高原の地表熱流量測定データは比較的限られており、顕著な空間非定常性を示しています。さらに、下図に示すように、ノンパラメトリック局所加重散乱平滑化(LOWESS)トレンドラインは、モホ面深度、地形、地殻変動単位、若いリフトバレーまでの距離といったパラメータと地表熱流量の間に大きな変動を示しており、地表熱流量と地質学的・地球物理学的パラメータの間に複雑な非線形関係があることを示唆しています。

地質学的特徴と地表熱流量値の散布図

この問題に対処するため、研究者らはGNNWRモデルを採用しました。このモデルは、通常の線形回帰(OLR)とニューラルネットワークアルゴリズムを組み合わせることで、空間的な非定常性を正確に捉え、地表熱流量と地質学的・地球物理学的データとの相関関係を分析するための堅牢な回帰フレームワークを確立します。

GNNWRモデルの解釈可能性をさらに向上させ、各変数の地表熱流量値への寄与を正確に定量化するために、研究者らはSHApley Additive exPlanations(SHAP)値計算法を採用しました。この手法は、局所的な相互作用を定量化し、特定の予測における個々の特徴に重要度を割り当てることで、局所的なニュアンスをより詳細に説明することができます。この統合アプローチに基づき、研究者らは解釈可能性を強化した地理ニューラルネットワーク加重回帰モデル(EI-GNNWR)を提案しました。
SHAPチュートリアルリンク:
https://go.hyper.ai/deK6H

EI-GNNWR モデルは他のモデルに比べて予測精度が大幅に高くなっています。

EI-GNNWR モデルの有効性をテストするために、研究者は、地熱データが豊富で正確な地域であるオーストラリアを検証地域として選びました。

オーストラリアは広範な地熱探査の中心地であり、豊富で比較的正確な地表熱流量測定値を保有しているため、データ駆動型手法の有効性を検証する理想的な試験場となっています。これに基づき、研究者たちはまずオーストラリアをモデルの試験地として選び、オーストラリアにおける地表熱流量の空間分布の予測を、4つの異なるモデル(極度勾配ブースティング(XGBoost)、完全結合ニューラルネットワーク(FCNN)、通常線形回帰(OLR)、地理重み付け回帰(GWR))と比較しました。

評価結果は下の図に示されています。EI-GNNWRモデルは、R²値が0.823と優れた予測性能を示しており、XGBoost、FCNN、OLR、GWRモデルと比較してそれぞれ36%、31%、22%、4%高くなっています。さらに、正規化RMSEはわずか0.10で、XGBoost、FCNN、OLR、GWRモデルと比較してそれぞれ47%、50%、44.4%、23%の削減となっています。オーストラリアにおけるXGBoostモデルの以前のR²値と比較すると、このモデルは17%の改善を示しており、正規化RMSEも以前の報告よりも55%低くなっています。

  • R²は、モデルがターゲット市場にどれだけ適合しているかを評価するために使用される統計指標です。R²が高いほど、適合性が高く、予測性能も優れていることを示します。
  • RMSE(二乗平均平方根誤差)は、回帰モデルの予測誤差を評価する際によく用いられる指標です。これは、モデルの予測値と実際の値の差を測定します。RMSEが小さいほど、モデルの予測値は実際の値に近くなります。

図3. オーストラリアにおける地表熱流量予測モデルの比較評価

(a) EI-GNNWRモデル
(b) GWRモデル
(c) XGBoostモデル
(d) FCNNモデル
(e) OLRモデルマップ上の円は測定点を表し、隣接する散布図(f~j)は測定された地表熱流値とモデル予測の関係を示しています。

空間知能法によって青海チベット高原の地表熱流の分布が明らかに

研究者らは、オーストラリアでEI-GNNWR法の有効性を検証した後、チベット高原とその周辺地域の地表熱流量測定点を使用して新しいモデルをトレーニングしました。

結果によると、このモデルは高い予測精度を持ち、R²値は0.91、正規化RMSEは0.07、誤差レベルは7%以内に抑えられています。研究者らは、下図に示すように、チベット高原の表面熱流量(SHF)分布図を作成しました。チベット高原の平均熱流量は66.2 mW/m²で、世界平均の62.8 mW/m²を大幅に上回っています。世界的に最も地殻変動が活発な地域の一つであるチベット高原の熱流量分布は不均一です。高熱流量地域は主に南部、北東部、南東部に集中しており、特に高原の北東境界であるヤルンツァンポ縫合帯と雲南省西部の騰衝地域に集中しています。

EI-GNNWRモデルによるチベット高原の地表熱流量の空間分布図

地熱形成の決定要因をより深く理解するため、研究者らはEI-GNNWRモデルにおけるSHAP値の空間分布(下図参照)も解析し、地質学的変数と地球物理学的変数の役割に焦点を当てました。この手法は、各変数が地表熱流の形成に具体的にどのように寄与しているかを明らかにし、これらの変数と地熱活動の関係を解明します。

研究者たちは、チベット高原南西部の熱流パターンに焦点を当て、地熱発電の形成における地質学的要因と地球物理学的要因の相互作用を探りました。ヤルンツァンポ川と怒江川の間の地域(下図のエリアI)を例にとると、予測される地表熱流は90 mW/m²を超えています。SHAP値は、海嶺からの距離と重力平均曲率が地表熱流の増加にプラスの影響を与えていることを示しており、ヒマラヤ造山帯における局所的な融解と高い地表熱流値と一致しています。重力平均曲率は地熱異常の形成に大きな影響を与え、特に低地震速度地域の造山帯の融解帯で顕著です。

下図の領域IIでは、地表熱流量が著しく高くなっていますが、これは海嶺の近接性と地形の複雑さに密接に関係しています。若い地殻領域における海嶺は、マントル物質の湧昇を通じて地表熱流量に影響を与え、地形の変化は地熱活動の分布と強度を形作り、この地域特有の地熱パターンを形成しています。

チベット高原上の予測地表熱流量と、この値に影響を与える主要な地質学的および地球物理学的パラメータの SHAP 値の空間分布の地図。

GNNWR をベースとしており、複数の分野での地球科学アプリケーションを促進します。

2020年、浙江大学地球科学学院の研究者らは、複雑な地理プロセスを伴う様々な領域における空間的不安定性に対処するためのモデルである地理ニューラルネットワーク加重回帰(GNNWR)を提案しました。このモデルに基づき、研究者らは海洋学、地理学、大気科学、地質学など、複数の分野を対象とした一連のモデルを提案し、30本以上の関連論文を発表しています。
論文の宛先:
https://www.tandfonline.com/doi/full/10.1080/13658816.2019.1707834

GNNWR オープンソースアドレス:

https://github.com/zjuwss/gnnwr

具体的には、住宅価格分析の分野において、 「空間的近接性」という抽象的な概念に基づく損失関数の構築とニューラルネットワークの学習の難しさという課題に対処するため、研究者らはOSPとGNNWRをさらに組み合わせ、osp-GNNWRモデルを構築しました。武漢の住宅価格に関するシミュレーションデータセットと実証事例の研究を通じて、このモデルはグローバルなパフォーマンスが向上し、複雑な空間プロセスと地理的現​​象をより正確に記述できることが示されました。
レポート全文を読むにはクリックしてください:武漢の住宅価格を正確に予測!浙江大学GIS研究所は、複雑な空間プロセスと地理現象を正確に記述するOSP-GNNWRモデルを提案しています。

大気科学分野において、 GNNWRモデルは空間的に非定常な回帰関係を構築することでPM2.5濃度を推定し、全国における高精度で詳細なPM2.5分布情報を提供することができます。例えば、地理空間モデリングにより、北京から連雲港にかけてPM2.5濃度が概ね高いことが分かりました。これは風向や風速などの要因によるものと考えられます。さらに、特定の地域に保護林が存在することで、PM2.5の拡散が抑制されている可能性も考えられます。

関連論文「空間ニューラルネットワーク加重回帰法による中国におけるVIIRS IP AODによる高解像度地上レベルPM(2.5)の衛星ベースマッピング」がMDPIに掲載されました。

論文の宛先:
https://www.mdpi.com/2072-4292/13/10/1979

地質学分野、特に金鉱床の空間分布予測において、GNNWRモデルは空間パターンとニューラルネットワークを統合し、シャプレーの加法解釈理論と組み合わせることで、予測精度を大幅に向上させるだけでなく、複雑な空間シナリオにおける鉱物予測の解釈可能性も高めます。
詳細レポートを表示するにはクリックしてください: 浙江大学の Du Zhenhong チームは、5 つの先進モデルを凌駕し、鉱化予測の精度を向上させる GNNWLR モデルを提案しています。

海洋生態環境モデリングの分野では、研究者らが新たなディープラーニング予測モデル「ChloroFormer」を提案しました。このモデルは、フーリエ解析とTransformerニューラルネットワークを組み合わせ、時間分解アーキテクチャを採用することで、CHL-a濃度予測の精度を効果的に向上させます。さらに、研究者らは2つの異なる沿岸研究海域で実験を行いました。その結果、提案モデルは、多段階予測精度において他の6つの比較モデルを凌駕するだけでなく、極端かつ頻繁な藻類ブルーム発生状況下でも相対的な優位性を維持することが示されました。
詳細レポートを見るにはクリックしてください:ディープラーニングが赤潮危機に立ち向かう!浙江大学GIS研究所は、海洋藻類の異常発生を早期に警告できるChloroFormerモデルを提案しています。

今後、チームはGISの理論と方法、地質科学のインテリジェント分析プラットフォーム技術を全面的に開発し、GeoAIの開発を継続的に模索していくことに尽力します。

GNNWR 研究グループリーダー、研究員 Wu Sensen の個人ホームページと時空間インテリジェント回帰モデルの紹介:
https://mypage.zju.edu.cn/wusen