618ZXW

韓国のチームがRetrieval-Retroを開発し、無機材料の逆合成の効率を大幅に向上させ、NeurIPS 2024に選出されました。

2023年11月、米国ローレンス・バークレー国立研究所の科学者たちは、ロボットアームの周りで息を呑んで見守っていた。AIを活用したこの材料合成プラットフォーム「A-Lab」は、41種類の新規無機材料の合成に成功した後、初めての合成失敗を経験したばかりだった。赤い警告灯が点灯すると、研究室は歓声に包まれた。プロジェクトリーダーのガーブランド・セダー教授は、「この失敗は成功よりも価値がある。溶媒のダイナミクスに関するAIの理解における盲点を露呈したのだ。これは、人間と機械の共進化にとって極めて重要な瞬間である」と説明した。

この一見異例な祝賀行事は、無機材料合成分野における前例のないパラダイムシフトを反映しています。有機化学者E.J.コーリーが1960年代に逆合成分析を提唱して以来、無機化学者たちは自らの「聖杯」を探し求めてきました。それは、レゴブロックを分解するように、複雑な無機材料を実用的な合成ステップへと分解する方法です。

この夢は2020年に好転しました。中国科学技術大学の于樹紅院士率いるチームが、機械学習を用いて界面エネルギー差を予測し、半導体ナノワイヤ上の特定の位置に磁性材料を「刻み込む」ことに成功したことをNature Nanotechnology誌に発表したのです。かつて学術界による20年にも及ぶ実験の積み重ねが必要と考えられていたこの技術は、AIによってわずか3ヶ月で解明されました。

変化の波は予想よりも早く到来しました。2023年、 Google DeepMindのGNoMEプラットフォームはわずか17日間で380個の安定した無機結晶をスクリーニングし、そのうち52個が実験的に検証されました。さらに驚くべきことに、ノースウェスタン工科大学のチームが宇宙船用セラミックコーティングを開発していた際、 AIは「まずマイクロクラックネットワークを構築し、次に修復剤で埋める」という直感に反する手法をリバースエンジニアリングしました。この「損傷から損傷へ」という戦略により、材料の耐熱性が300℃向上し、まるで宇宙船のための自己修復型「スケール」を鍛造したかのようでした。

世界中の研究室の換気フードの裏では、静かに二重の革命が進行しています。AIは人間の合成経験から学ぶだけでなく、人間の直感を超越する全く新しい合成経路を探求し、創造しているのです。最近、韓国化学技術研究院(KRICT)は韓国科学技術院(KAIST)と共同で、「Retrieval-Retro」と呼ばれる新しい無機逆合成計画手法を提案しました。この手法は、熱力学的関係とアテンションメカニズムを組み合わせることで、無機材料合成の効率と精度を向上させることに成功しました。新規合成処方の特定におけるこの手法の卓越した性能は、材料発見の分野に新たな希望をもたらし、将来の研究においてより大きな役割を果たすことが期待されています。

「Retrieval-Retro: 専門知識による検索ベースの無機逆合成」と題された関連研究成果は、AI分野のトップ学術会議であるNeurIPS 2024に選出されました。

論文リンク:
https://doi.org/10.48550/arXiv.2410.21341

データセットのダウンロードリンク:

https://go.hyper.ai/ortxj

オープンソースアドレス:

https://github.com/HeewoongNoh/Retrieval-Retro

無機逆合成: 実験的な試行錯誤に大きく依存しており、AI アルゴリズムはまだ改善が必要です。

材料科学の長い歴史において、かつては試行錯誤こそが未知を探求する唯一の道でした。科学者たちは、盲人が象を触るように、配合を何度も調整し、サンプルを焼成し、偶然にも性能の「スイートスポット」に触れるまで続けました。このモデルは、逆合成分析の登場によって有機合成分野で初めて覆されました。1964年、E.J. Coreyは、標的分子をジグソーパズルのようにシントンに分解し、盲目的な試みではなく論理的推論によって合成経路を見出すことを提案しました。ベンゾフラン合成問題の解決と同様に、化学者はもはやフェノール誘導体のあらゆる組み合わせを試験する必要はなく、重要なCO結合の切断部位を特定することで、フェノールと1,3-ジカルボニル化合物間の鉄触媒カップリング経路を正確に特定しました。化学結合のインテリジェントな切断に基づくこの革新的な考え方により、有機合成は経験主義から合理的設計の時代へと移行しました。

しかし、戦場が無機の世界に移ると、事態ははるかに複雑になります。第一に、無機化合物ははるかに複雑な結合メカニズムを伴うため、有機分子のように官能基を介して構造と特性の関係をモジュール的に解析することは困難です。第二に、無機合成反応は多相界面の発達や準安定相との競合を伴うことが多く、有機系の溶液反応よりも反応速度論の予測が困難です。さらに、無機結晶の場安定エネルギーや欠陥形成エネルギーなどの重要なパラメータを計算する現在の計算化学手法は、信頼性の高いリバースエンジニアリングをサポートするのに十分な精度ではありません。つまり、無機逆合成研究は依然として実験的な試行錯誤に大きく依存しており、その理論的枠組みは有機系のものよりもはるかに複雑です。

今日、AI技術の統合は、この分野に全く新しい道を切り開きました。例えば、生成的敵対的ネットワーク(GAN)は人間の経験の限界を打ち破り、独特な電磁気特性を持つペロブスカイト格子などの革新的な構造の設計を可能にしました。量子モンテカルロ法はミクロな世界にまで踏み込み、高温超伝導体におけるクーパー対の量子エンタングルメント機構を解析しています。グラフニューラルネットワークもまた進歩を遂げており、原子軌道の再結合規則を解読することで、無機材料に特有の量子反応規則体系を徐々に構築しています。

AI技術がこれらの分野において進化を続けるにつれ、無機逆合成の課題は徐々に克服されつつあります。こうした技術革新の波の中で、畳み込み変分オートエンコーダーは材料の逆設計の先駆者となり、この分野に一筋の希望の光をもたらしました。その後、ElemwiseRetroモデルは前駆体テンプレートライブラリをさらに統合し、予測精度を最適化しました。しかし、既存のアルゴリズムは大きな進歩を遂げたものの、 「類似材料を参照する」化学者の意思決定の知恵を完全に再現するには至っていません。つまり、AIはより正確に材料を設計するために、人間の化学者の思考プロセスをさらに学習する必要があるのです。

この欠点を克服するため、ソウル国立大学の研究チームは、「Retrieval-Retro」と呼ばれる新しい無機逆合成計画手法を開発しました。この手法は、高度な検索技術と注目メカニズムを用いて前駆体情報を効率的に特定・抽出し、物質の発見と合成を加速することを目的としています。広範な実験により、Retrieval-Retroは様々なシナリオにおいて優れた性能を発揮することが実証されており、特に年区分というより現実的で困難なシナリオにおいて優れた性能を発揮します。無機材料の新規合成処方を発見する優れた能力は、実用的な物質発見におけるその大きな応用可能性を十分に示しています。

Retrieval-Retro: 無機逆合成プログラミングへの革新的なアプローチ

Retrieval-Retro の中核は、2 つの補完的な検索エンジン (Masked Precursor Completion (MPC) 検索エンジンと Neural Reaction Energy (NRE) 検索エンジン) を使用して、参考資料として 24,304 件の材料科学論文から抽出された 33,343 の無機材料合成配合に基づいて前駆体情報を抽出することにあります。

データセットのダウンロードリンク:

https://go.hyper.ai/ortxj

MPC検索エンジンは、前駆体間の依存関係を学習し、ターゲット物質と類似の前駆体を持つ参照物質を特定します。ターゲット物質と知識ベース内の全物質間のコサイン類似度を計算することで、最も類似性の高い上位K個の物質を検索します。この手法は、前駆体とターゲット物質間の相関関係を効果的に捉え、その後の合成計画に重要な手がかりを提供します。

Retrieval-Retroの全体的な枠組み

しかし、MPC検索エンジンは類似の前駆体セットを識別できるものの、無機合成において極めて重要な材料間の熱力学的関係を無視しています。そのため、NRE検索エンジンは、対象物質と前駆体セット間のギブス自由エネルギー(∆G)を考慮し、熱力学的駆動力に基づいて参照物質を選択します。一定の圧力と温度下では、負の∆Gは合成反応が自発的に起こり得ることを示し、∆G値が大きいほど、前駆体セットが対象物質を合成する確率が高くなります。NRE検索エンジンは、事前トレーニングと微調整メカニズムを通じて、DFT計算と実験生成エネルギーデータを用いて対象物質と参照物質の生成エネルギーを予測し、熱力学的に最も有利な参照物質を選択します。

Retrieval-Retroは、前駆体情報の抽出において、自己注意と交差注意のメカニズムを採用しています。対象物質と参照物質を組成グラフエンコーダを用いてエンコードすることで、モデルは自己注意によって参照物質の表現を強化し、交差注意によって対象物質の表現と強化された参照物質の表現を統合することで、暗黙的に前駆体情報を抽出します。このアプローチは、参照物質の情報を最大限に活用するだけでなく、参照物質から前駆体情報を直接使用する際の制限を回避し、モデルの学習能力と新しい合成処方の導出能力を大幅に向上させます。

Retrieval-Retroの有効性を検証するため、研究者らは既存の無機逆合成法およびベースラインアプローチとRetrieval-Retroを比較しました。これらの手法には、RoostやCrabNetなどの物質構成に基づく表現学習法や、新たに提案されたベースライン手法(Composition MLPやGraph Networkなど)が含まれます。実験結果によると、Retrieval-Retroはすべてのテストシナリオにおいてベースラインモデルを上回り、特に年ベースの設定ではパフォーマンスの向上がより顕著でした。これは、Retrieval-Retroが理論的に革新的であるだけでなく、実用化においても高い適応性と有効性を備えていることを示しています。

年別セグメンテーションとランダムセグメンテーション条件下でのモデルパフォーマンスの比較

物質錬金術の究極形:AIが周期表に疑問を持ち始めるとき。

ソウル国立大学のRetrieval-Retroモデルが従来の検索の限界を打ち破ったことを背景に、無機逆合成分野は新たな発展の機会を迎えています。 2024年現在、人類は118番元素(Og)を合成しています。これらの元素の現実世界での半減期は非常に短いかもしれませんが、AI支援による材料発見への応用が徐々に明らかになりつつあります。

現実と仮想を融合させたこの探究は、材料科学の認知的側面を再構築しつつあります。従来の無機化学は依然としてポーリングの法則とヒューム・ロザリーの法則に忠実ですが、AIはテンソルネットワークを活用して電子相関効果を再構築し、量子アニーリングアルゴリズムを用いて高温超伝導体の潜在的メカニズムを探求し始めています。例えば、A-Labはロボット工学と機械学習を組み合わせることで、様々な新しい無機材料の合成に成功し、材料合成におけるAIの大きな可能性を実証しています。

この認知的飛躍は二重の革命をもたらす。技術レベルでは、マイクロソフトの量子コンピューティング チームが、新たにリリースされた量子チップ「Majorana 1」を通じて、トポロジカル キュービットと逆合成アルゴリズムを組み合わせ、トポロジカル導体材料を使用してより安定的かつ効率的な量子コンピューティングを実現している。哲学レベルでは、 MIT の合成知能研究所が、仮想反応器で化学合成プロセスをシミュレートして最適化することで、AI が物質世界に対する人間の理解をどのように再定義できるかを研究し始めた。マリー キュリーが瀝青石からラジウムを抽出したように、AI は仮想反応器で名前のない物質の形態を沈殿させているのかもしれない。

新旧のパラダイムが交差する地点に立つ無機逆合成は、まさに刺激的な章を刻みつつあります。ラヴォアジエ時代から受け継がれてきた物質分解の伝統を継承しつつ、人間と機械の協働による「ポストヒューマン材料科学」の誕生も同時に促しています。上海シンクロトロン放射光施設のX線とGNoMEのニューラルネットワークが共同で380番目の安定結晶を解析した時、私たちは技術の進化だけでなく、認知の次元的向上も目の当たりにしました。量子力学が古典物理学を覆したように、AIは材料科学において、複数の現実が重なり合う「シュレーディンガーの道具箱」を開きつつあるのです。

真の革命は機械が人間に取って代わることではなく、AIが非局所波動関数を用いて化学結合を再定義し始めることで、人類がついに物質世界を観察するための第二の目を手に入れることにある、という点に注目すべきです。この「機械の目」の視線の下で、無機材料合成は経験的な技能から、古典化学と量子宇宙を繋ぐ認知的な架け橋へと変貌を遂げつつあります。