618ZXW

AAAI 2025 に選出されました! 香港理工大学のチームがグラフ Transformer を使用して有機材料の分子光電子特性を正確に予測します。

1966年、日本の東北大学の研究室から、エネルギーの歴史を塗り替える画期的なデータが発表されました。紫色の色素結晶の薄膜を太陽光の下に置いたところ、電流検出器の信号が突然急上昇し、研究者たちは衝撃を受けました。有機材料はシリコン結晶に頼ることなく光電流を生成できるのです! 『応用物理学会誌』に掲載されたこの画期的な発見は、まるで深いプールに投げ込まれた石のように、半世紀にもわたる科学研究に波紋を広げました。

しかし、有機太陽電池(OSC)への道のりは想像をはるかに超える困難を伴いました。その後40年間、研究者たちは「効率の呪い」に囚われていました。有機材料中の励起子拡散距離は10ナノメートル未満で、生成された電子正孔対は電極に到達する前に消滅してしまうのです。転機は2005年に訪れました。UCLAのヤン・ヤン率いるチームが植物の光合成系に着想を得たのです。彼らは葉緑体における光合成系IIとIの分業を模倣し、P3HTとPCBMを用いたナノスケールの相互浸透ネットワークを構築しました。この「バルクヘテロ接合」構造により、励起子分離効率は60%に向上し、デバイス効率は歴史的なブレークスルーとなる5%に達しました。この成果はScience誌の表紙を飾りました。

それ以来、有機太陽電池の効率限界は着実に突破されてきました。しかし、有機太陽電池の効率が20%の限界に近づくにつれ、従来の「試行錯誤」型の研究開発モデルはボトルネックに直面しています。新たな分子の背後には数兆個もの構造的組み合わせが潜んでおり、これが計算材料科学の飛躍的な発展を促しました。

香港理工大学のチームは最近、分子設計における認知革命を巻き起こすフレームワーク「RingFormer」を発表しました。この手法は、Transformerアーキテクチャを用いて原子と化学環の階層的グラフを構築し、ローカルメッセージパッシングとグローバルアテンションメカニズムを組み合わせることで、分子の光電特性を正確に予測します。ハーバード大学のクリーンエネルギープロジェクトデータベース(CEPDB)のテストセットでは、従来の手法と比較して22.77%高いパフォーマンスを示しました。これは、新材料の開発サイクルを数年から数週間に短縮することに相当し、有機太陽電池研究が「計算誘導実験」の新たな時代へと正式に移行したことを示しています。

「RingFormer: 有機太陽電池の特性予測のためのリング強化グラフトランスフォーマー」と題された関連する研究成果は、AI分野のトップ学術会議であるAAAI 2025での発表対象に選ばれました。

論文リンク:
https://doi.org/10.48550/arXiv.2412.09030

研究で使用された関連データセットのダウンロードリンク:

https://hyper.ai/cn/datasets/37721

GNNは長い従来のR&Dモデルを変える

世界的なエネルギー転換における再生可能エネルギーの需要増加に伴い、有機太陽電池(OSC)は優れた光電変換特性を有することから、研究のホットスポットとなっています。低分子有機半導体材料をベースとするこれらのデバイスは、共役構造における電子供与体と受容体の相互作用を介して光エネルギーを電気エネルギーに変換します。その変換効率は分子構造の複雑さと密接に関連しています。しかし、従来の研究開発モデルは、広範な試行錯誤と長期にわたる合成プロセスに依存しており、研究開発サイクルには3~5年を要することが多く、材料イノベーションのスピードを著しく制限しています。

潜在的なOSCをより効率的にスクリーニングするため、研究者たちは機械学習手法を用いてその性能を予測し始めています。現在、フィンガープリントベースの手法が広く用いられており、通常は手作業で設計された分子フィンガープリント(MACCSやECFPなど)を分子特徴として用い、ランダムフォレストやサポートベクターマシンなどの既存の機械学習モデルに入力しています。しかし、これらのフィンガープリントは分子構造を簡略化した表現であり、特に構造が複雑なOSCにおいては、複雑な分子情報や相互作用が考慮されていません

グラフニューラルネットワーク(GNN)はかつて、分子を原子ノードと化学結合のトポロジカルグラフとして抽象化し、深層学習によって構造的特徴を捉えることで、この課題を解決する可能性を示唆していました。しかし、既存のモデルはOSC分子の解析において二重の課題に直面しています。一つには、 GNNの「原子近視」により、複数のベンゼン環にまたがる長距離電子結合効果を捉えることが困難です。もう一つは、環系間の接続パターンの特性評価が不十分であるため、重要な構造的差異(例えば、線形接続やスタートポロジーが励起子分離に与える影響など)を区別することが不可能です。

これらの課題に対処するため、香港理工大学の研究チームは革新的なフレームワーク「RingFormer」を提案しました。これは、 OSC分子のリングシステムを捉える初のグラフTransformerフレームワークです。このフレームワークは、従来の原子レベルモデリングの単一視点を打ち破り、原子とリングの二重レベルの特徴融合システムを構築します。

この方法の核心は、動的な相互作用メカニズムを確立することにあります。つまり、原子レベルでの化学結合や電荷分布などの微視的特徴に対する感度を維持しながら、縮合環の共有エッジや非縮合環の空間配置などの巨視的構造特徴を正確に分析するために、環レベルでクロスリングアテンションネットワークを確立します。

環間接続行列と環内原子重み付けアルゴリズムを導入することで、このモデルは重要な環系とその相互作用モードを自律的に特定できます。実験結果によると、この2段階モデリング戦略により、電力変換効率(PCE)の予測精度が92%まで向上し、 5環以上の分子においてより強力な特性評価能力を発揮することが示されています。この画期的な進歩は、OSC材料設計に新たなパラダイムをもたらすだけでなく、複雑な分子系の機械学習モデリングにも新たな道を切り開きます。

RingFormer: 原子レベルとリングレベルの両方で OSC の分子構造を表します。

この手法をより適切に評価するために、研究者らは5つのOSC分子データセットをまとめました。これには、密度汎関数理論(DFT)に基づいて生成されたCEPDBデータセット、および異なるタイプのOSC分子で構成されるHOPV、PFD、NFA、PDデータセットが含まれます。これらのデータセットは、トレーニングセット、検証セット、テストセットに6:2:2の比率で分割されました。

研究で使用された関連データセットのダウンロードリンク:

https://hyper.ai/cn/datasets/37721

OSC分子の原子レベルおよびリングレベルの構造的特徴を正確に捉えるために、本研究ではRingFormerフレームワークを提案する。まず、多層OSCダイアグラムを構築する。次に、この多層OSCダイアグラムをRingFormerレイヤーを通して包括的にエンコードし、その性能を予測する。下図に示すように、この多層OSCダイアグラムには、原子レベル、リングレベル、およびインターレベルダイアグラムが含まれている。

RingFormerフレームワーク

原子レベルの図はOSC分子の原子結合構造を詳細に示し、リングレベルの図はリングとその結合に焦点を当て、複雑な環系を捉えます。クロスレベル図はリングと原子の関係をモデル化し、分子の階層構造を完全に表現します。これら3つのレベルを統合することで、OSC分子構造の包括的な記述が可能になり、より正確な性能予測につながります。

次に、 RingFormerフレームワークは、ローカルメッセージパッシングとグローバルアテンションメカニズムを統合し、各層における固有の構造パターンを捕捉し、表現力豊かなグラフ表現を学習します。原子レベルでは、RingFormer層はメッセージパッシングGNNを利用して、ローカルな構造特徴を原子ノード表現にエンコードします。

リングレベルグラフの場合、RingFormer層は、リングシステム全体のパターン、特にリング間の接続を捉えるために特別に設計された革新的なクロスアテンションメカニズムを導入します。さらに、RingFormer層は、階層を越えたメッセージパッシングを通じて、リングノードとアトミックノード間の相互作用を促進します。各RingFormer層の終端には、異なるレベルからの情報が補完的であることを保証するための階層的融合戦略が実装されています。

最終的に、RingFormer は多層スタッキングの後、原子とリングのノード表現を集約して、OSC の分子構造を完全にエンコードするグラフ表現を形成し、パフォーマンス予測のための強固な基盤を提供します。

次に、OSC性能予測におけるRingFormerの有効性を評価するため、研究者らは5つのOSC分子データセットにおいて、RingFormerを11のベースラインモデルと比較しました。実験結果では、RingFormerがベースラインモデルを一貫して上回る性能を示しました。特に、大規模CEPDBデータセットにおいて、RingFormerは最近の競合モデルと比較して22.77%という大幅な相対的改善を達成しました。

下表に示すように、 RingFormerは電力変換効率(PCE)の予測においてほぼすべてのデータセットで最高のパフォーマンスを示し、PFDデータセットに次いで2位にランクされています。特に、平均リング数が最も多いNFAデータセットでは、RingFormerはフィンガープリントベースの手法であるECFPを4.96%上回ります。さらに、RingFormerはより大規模で複雑なOSC分子においても優れたパフォーマンスを示し、4つのデータセットのうち3つで最高のパフォーマンスを達成しました。

RingFormerと他のベースラインモデルの予測性能の比較

研究者らは、CEPDBデータセットを用いて、RingFormerのマルチタスク学習における性能をさらに評価しました。その結果、 RingFormerは6つのターゲット性能指標すべてにおいて、他の競合モデルを一貫して上回り、多くの場合、顕著な優位性を示しました。さらに、メッセージパッシングとグローバルアテンション機構の統合により、GPSもすべてのターゲットにおいて非常に優れた性能を発揮し、RingFormerに次ぐ性能を示しました。これは、 OSC分子における局所的および全体的な構造的特徴を同時に捉えることの重要性をさらに裏付けています。

最後に、研究者らは、異なる環数を持つOSC分子を扱う際のRingFormerの性能も評価しました。分子内の環数が増加するにつれて、RingFormerの性能向上もそれに応じて増加し、 RingFormerの優れた性能と環系の複雑さの間に明確な正の相関関係があることを示しました。

さらに、本研究では、UMAP技術を用いてCEPDBテストセット内のOSC分子のグラフィカル表現を可視化しました。GPSによって生成された埋め込みと比較して、 RingFormerによって生成された埋め込みは、OSC分子の環の数に基づいて明確に区別できました。これらの観察結果は、RingFormerが環系の複雑な構造を捉える優れた能力をさらに裏付けています。

AIテクノロジーは産業の未来を大きく変えつつあり、OSCを支える中国の力は無視できない。

世界的なエネルギー転換の波の中で、有機太陽電池(OSC)は、軽量、柔軟、低コストという特徴により、徐々に研究室から産業化の最前線へと移行しつつあり、有機太陽電池の分野における中国の科学者の研究の進歩は目覚ましいものがあります。

2015年、中国科学院の侯建輝教授率いる研究チームは「ポリマー・小分子相乗効果」理論を提唱し、非フラーレン系受容体ITICを開発しました。この分子は蝶型の立体構造を有し、分子間の精密な連結を可能にします。この研究成果は、標高4,200メートルの青海高原という過酷な気候条件下でも82%の効率を維持でき、高地における世界初の実証例となりました。

2025年までに、蘇州大学の李耀文氏のチームは、「逐次結晶化戦略」を通じて活性層の分子配列勾配を制御することで20.82%の認証効率を達成し、厚膜デバイス産業化のボトルネックを突破し、 400ナノメートル厚膜の効率を17.93%にまで引き上げ、ロールツーロール印刷技術の発展の基礎を築きました。

一方、寧波材料工学研究所の葛子怡(Ge Ziyi)教授らの研究チームは、キノキサリンをベースとしたアクセプターSMAを設計した。分子の規則的な配列により、リジッドOSCとフレキシブルOSCの効率はそれぞれ20.22%と18.42%に向上した。2,000回の折り曲げ後でも96%の性能を維持でき、ウェアラブルエネルギーデバイスの新たな基準を打ち立てた。

AIと有機太陽電池研究の融合は、2023年には既に顕著でした。蘇州大学機能性ナノ&ソフトマテリアル研究所の李有勇教授チームと袁建宇教授チームは、機械学習を用いた有機太陽電池のハイスループットスクリーニングに共同で取り組みました。彼らはDFT計算を用いて有機分子の電子構造特性を深く探究し、ビッグデータ技術を用いて機能性材料データベースを構築することで、機械学習モデルのトレーニングのための強固な基盤を提供しました。この研究は、有機光電子材料のスクリーニング効率を向上させ、計算コストを削減しただけでなく、光電子デバイスの設計と最適化にも強力な支援を提供しました。

*論文タイトル:

深層学習とアンサンブル学習を用いた有機太陽電池の効率的なスクリーニングフレームワーク
*論文リンク:

https://www.nature.com/articles/s41524-023-01155-9

2024年、イリノイ大学とトロント大学の研究チームは、画期的な「閉ループ転移(CLT)」手法を提案し、AIを解釈可能な化学知識エンジンへと変革しました。この手法は、物理的特徴選択と教師あり学習を組み合わせ、 5ラウンドの閉ループ実験で30種類の新規分子をスクリーニングしました。その中には、光安定性が5倍に向上した光捕集性分子も含まれていました。この手法は、高エネルギー三重項状態密度(TDOS)と安定性の間に強い相関関係があることを明らかにし、光劣化問題に対する普遍的な設計原理を提供しました。

* 論文タイトル:

閉ループ転送により人工知能が化学知識を生み出すことが可能に
* 論文リンク:

https://doi.org/10.1038/s41586-024-07892-1

同じく2024年には、ドイツのヘルムホルツ研究所のChristoph J. Brabec氏、厦門大学のJianchang Wu氏、Luyao Wang氏、ドイツのカールスルーエ工科大学のPascal Friederich氏、韓国の蔚山科学技術院のSang Il Seok氏が共同で、閉ループ型の自動ワークフローを開発しました。このワークフローは、機械学習と実験を組み合わせることで、特定のデバイス要件に合わせた分子設計ルールを迅速に生成し、有機太陽電池などの次世代高性能光電子デバイス開発の基盤を築きます。

* 論文タイトル:

逆設計ワークフローによりペロブスカイト太陽電池に適した正孔輸送材料を発見
* 論文リンク:

https://doi.org/10.1126/science.ads0901

これは、世界の有機太陽電池研究におけるAI技術の役割がますます重要になっていることを示しています。AI技術は、新材料の発見と性能最適化を加速させるだけでなく、長年の科学的課題に対する新たな視点と解決策を提供しています。技術の継続的な成熟と産業化の加速に伴い、中国の専門知識は世界の有機太陽電池技術の発展を牽引する重要な原動力となっており、将来のエネルギー革命にさらなる中国の知恵とソリューションを提供することが期待されています。