|
2023年12月、GoogleのDeepMindは、自社のディープラーニングモデル「GNoME」をNature誌に発表し、無機材料の新たな結晶構造を220万点発見したと主張しました。この画期的な成果から1週間も経たないうちに、Microsoftは材料リバースエンジニアリングのための生成AIモデル「MatterGen」を発表し、将来的には、望ましい特性に基づいて新材料の構造を直接設計できるようになると発表しました。 GoogleのGNoMEモデルが、広大な化学分野における新材料の迅速な発見を可能にするAIの可能性を実証したとすれば、MicrosoftのMatterGenは、リバースデザインを通じて特定のニーズに的確に応える生成AIの能力をさらに証明しています。どちらも材料化学におけるAIへの異なるアプローチを示しており、大規模な発見から「オンデマンド設計」への新たな技術的飛躍を示しています。1月16日、「無機材料設計のための生成モデル」と題されたMatterGenの成果が、ついにNature誌に正式に掲載されました。さらに嬉しいことに、このモデルはオープンソース化されました。HyperAIは公式ウェブサイトで「MatterGen無機材料設計モデルデモ」というチュートリアルを公開しており、ワンクリックで導入・運用が可能です。誰でもこのモデルの性能をテストできます。 チュートリアルリンク: https://go.hyper.ai/5mWaL 東南大学の王金蘭教授は、「深層生成モデルを用いた逆設計:材料発見の次のステップ」という論文の中で、従来の機械学習を用いた材料設計研究では、候補材料の特性を化学空間全体から予測し、大規模なスクリーニングを実施することで目標特性を持つ潜在的材料を見つけ出す研究がほとんどだと指摘した。しかし、逆設計では最適な経路に沿って適切な化合物を直接生成できる。王教授は、生成モデルが材料の逆設計に効果的な戦略であると考えており、これはマイクロソフトの研究とも一致している。 MatterGenは拡散モデルをベースとし、対象とする空間群に応じた構造を生成することができます。例えば、多属性磁性材料の設計において、高い磁気密度とサプライチェーンリスクの低い化学組成を両立した構造を提案します。同時に、このモデルは複数の調整可能なモジュールを備えており、化学特性、対称性、材料特性などの制約に基づいて微調整することで、特定の磁気特性、電子特性、機械特性を満たす材料を生成し、DFT(深層関数理論)を用いて検証することができます。そのため、特定のシナリオに基づいた新材料の「カスタマイズ」が近い将来実現する可能性があります。 上記の拡散モデルに加えて、現在主流の生成モデルには、敵対的生成ネットワーク (GAN)、変分オートエンコーダー (VAE)、自己回帰モデルなども含まれます。これらすべての中核となる原理は、データ分布を学習して新しいサンプルを生成することです。 この記事では、HyperAI が新材料の生成モデルリバース設計の価値を紹介し、バッテリー材料、高エントロピー合金、超伝導材料におけるこの技術の具体的な進歩について説明します。 新材料開発とタンパク質設計の「類似点」典型的な材料開発の問題では、特定の特性を持つ新しい材料を見つけることが期待されており、実際には目標特性を満たす適切な結晶構造が求められています。 かつて、新材料開発は主に試行錯誤に頼っていました。この「フォワードデザイン」手法は、構造から特性へとつながる発見を特徴としています。最も一般的な置換法を例に挙げましょう。La-Ba-Cu-O超伝導体は最も初期の銅系超伝導体でしたが、超伝導を示す温度は液体窒素温度よりも低い35 Kでした。研究者たちは構造からLaをYに置き換え、Y-Ba-Cu-O超伝導体が液体窒素温度よりも高い温度で超伝導を示すことを発見しました。しかし、この方法は開発サイクルが非常に長く、予測が非常に困難です。 コンピュータ技術と量子力学の進歩により、密度汎関数理論(DFT)に基づく材料予測手法が成熟しました。構造探索アルゴリズムとハイスループットコンピューティングを組み合わせることで、特定の制約下で特定のデータベースを用いて、候補物質を効率的にスクリーニングし、実験室で合成・試験することが可能になります。しかし、未知物質の化学空間は極めて広大で、異なる元素の組み合わせは数百万通りに達する可能性があるため、大規模なスクリーニングには膨大な計算コストがかかります。 AIを活用したリバースデザインは、従来の材料空間選択の考え方を打破し、目標とする性能要件を満たす材料構造を直接生成する新しいアプローチを提供し、効率的な材料設計と最適化を可能にします。 実際、AIを活用したリバースエンジニアリングは、バイオメディカル分野で既に画期的な進歩を遂げています。2024年10月、ノーベル化学賞がAIに初めて授与され、その半分はタンパク質設計への多大な貢献を称えられ、ワシントン大学のデイビッド・ベイカー氏に贈られました。ベイカー氏の多くの研究には、ディープラーニングを用いたリバースエンジニアリングによってアミノ酸配列を生成し、新規機能性タンパク質の設計に役立てた例が見られます。 2024年ノーベル化学賞受賞者 新素材の研究開発は、タンパク質設計と多くの類似点を持っています。例えば、材料のマクロ的な特性はそのミクロな構造によって決定されますが、タンパク質も同様です。タンパク質の分野では、アミノ酸配列がタンパク質を特定の二次構造、三次構造、さらには四次構造へと折り畳む過程を導き、それによって生物学的機能が決定されます。同様に、材料科学では、原子、化学結合、官能基の選択と配置によって分子構造、あるいはより複雑な材料構造が構築され、それがひいてはその特性を決定します。 この類似性により、タンパク質設計で人気の AI 手法は、リバースエンジニアリングによる材料特性の最適化、新しい構造の探索、まったく新しい材料の開発など、材料科学研究に洞察を提供できるようになります。 一方、強化学習、注意メカニズム、拡散モデル、事前トレーニング済みモデル、マルチモーダル技術、モデルアライメントメカニズムなど、バイオメディカル分野で出現している他の生成モデル、視覚モデル、言語モデル、その他の先進技術も、材料科学において幅広い応用の可能性を秘めています。 注目すべきは、新素材はバイオメディカルの長期にわたる臨床試験サイクルを経る必要がなく、倫理的および安全上の要因の影響を受けないため、実用化される可能性が高くなる可能性があることである。 この論文では、Microsoft MatterGen を例に、材料の生成 AI リバース デザインの新しいパラダイムを探ります。MicrosoftのMatterGenモデルは、主に拡散アーキテクチャに基づいています。まず、原子の種類、原子の位置、周期格子を徐々にランダム構造に分解し、次にこのプロセスを逆順に行うようにモデルをトレーニングすることで、ランダムノイズから元の物質構造を徐々に復元する方法をモデルに学習させます。論文の責任著者である謝天氏は、これがビデオ生成の核心的なアイデアと非常によく似ていると考えています。 OpenAIのSora動画モデルを例に挙げると、研究者たちはオートエンコーダと「動画圧縮ネットワーク」を用いて、入力画像または動画を低次元データセットに圧縮します。圧縮された動画は「時空間パッチ」に分解され、さらにTransformerによる処理を容易にするために1次元のデータシーケンスに変換されます。Transformerは各時空間パッチからノイズを除去し、デコーダは処理されたテンソルデータから動画を再構成します。 ソラワークフロー 一方、研究者たちは拡散アーキテクチャを基盤として、モデルを訓練し、既知の安定物質の構造を学習させました。訓練されたモデルは、ランダム分布から無条件にサンプリングを行い、逆のプロセスを経て、物質特性の理解に基づいて、特定の条件を満たす新しい物質構造を生成できるようになりました。さらに、研究者たちはネットワークの各層に条件を追加することで、基本モデルを微調整しました。これらの条件は、特定の化学的性質、対称性、あるいは任意のターゲット属性(磁性、密度など)などです。微調整後、モデルは指定された条件に基づいて物質構造を直接生成し、その安定性を計算手法によって検証できるようになりました。 以下に示すように、ストロンチウム-バナジウム酸化システムにおける新しい物質生成の場合、MatterGen によって生成された物質構造は非常に合理的であるように見え (fi)、計算によってこれらの物質が安定性を備えていることが検証されています。 対象化学システムで生成される物質 さらに、計算検証に加え、研究チームは中国科学院深圳先進技術研究所と協力し、MatterGenを用いて新規材料TaGr2O6の合成に成功しました。実験的に測定された体積弾性率は169GPaで、設計値200GPaに対する相対誤差は20%未満でした。研究チームは今後、科学者からのフィードバックを得て、モデルの継続的な改良と最適化を行い、実用価値の向上を目指します。 注目すべきは、材料設計における多くの問題は、室温超伝導体やバッテリー用超イオン伝導体といった極端な特性を持つ材料の探索に関わるため、従来の探索ベースの手法は実装が困難であるということです。しかし、ターゲット特性に基づく生成モデルは、こうした画期的な材料を発見する機会を提供します。マイクロソフトはこのモデルを用いて、バッテリー設計、太陽電池設計、炭素回収など、様々な材料の探索を行っています。 さらなる応用:高エントロピー合金や超伝導材料の開発を例に挙げると新素材は、航空宇宙、新エネルギー、電子情報、バイオメディカルといったハイテク分野の発展を牽引する礎石であるだけでなく、新技術、新設備、そして新プロジェクトを支える基盤であることは周知の事実です。しかしながら、我が国の素材産業は依然として伝統素材に大きく依存しており、新素材、特にハイエンドの新素材の供給は限られています。同時に、基幹技術の不足により、輸入素材への依存度が高く、他国からの制約を受けるという問題も依然として顕著です。 生成AIの発展に伴い、材料科学は新たな研究パラダイムシフトを迎えています。この新興分野への早期参入は、これまでの課題を克服し、「リープフロッグ(飛躍的発展)」を実現する機会となる可能性があります。本稿では、以下のセクションで、高エントロピー合金や超伝導材料の開発における具体的な応用例を用いて、生成AIが新材料のリープフロッグ発展にどのように貢献できるかを探ります。 高エントロピー合金 ガスタービン、原子炉、航空宇宙推進システムなどの工学用途では、優れた高温機械的特性を持つ金属合金への需要が高まっています。高エントロピー耐火合金(RHEA)は、様々な高融点耐火元素を添加することで、1000℃以上の高温でも高い強度を維持し、耐熱合金に匹敵する高温強度を示すため、研究者から広く注目を集めています。 しかし、他の高温合金と比較すると、RHEAの性能は特定の側面(例えば室温延性)において依然として課題を抱えています。従来、RHEAの設計は研究者の経験と直感に大きく依存しており、非常に不確実性が高いものでした。同時に、RHEAの可能な組成空間は非常に広く、数十億通りもの候補組成が存在するため、潜在的な合金の迅速な発見は著しく制限されています。 これに対し、ペンシルベニア州立大学材料科学工学科および計算・データ科学研究所の助教授であるウェズリー・ラインハート氏は、「高エントロピー耐火合金の逆問題設計ツールとしての生成的ディープラーニング」と題する論文をJournal of Materials Informatics誌に発表し、生成モデルは材料設計、特に高エントロピー合金に対する有望な新しいアプローチであるという予備的な結論を導き出しました。この研究は、JMIの年間優秀論文に選ばれました。 論文の宛先: https://www.oaepublish.com/articles/jmi.2021.05 本論文では、研究者らは、過去10年間で密度汎関数理論(DFT)などの計算手法が基本的に成熟し、大量のデータが蓄積されたことで、ディープラーニングの応用基盤が築かれ、「フォワードモデル」の開発が促進されたと述べています。しかし、巨大な設計空間は依然として重要な課題であり、生成モデリングの「リバースデザイン」がその解決策となります。 そこで研究者たちは、条件付き敵対的生成ネットワーク(CGAN)を用いて、生成器に追加の条件ベクトルを与えることで、その出力を制御しました。言い換えれば、条件ベクトルは目標特性(合金組成や性能指標など)に関する情報を提供し、潜在空間と目標指標とのマッピングを確立します。生成器は合金組成に基づいて合金性能データの確率分布を学習し、条件を満たすサンプルを生成します。注目すべきことに、このモデルはアルミニウム合金の設計に効果的に利用されており、計算手法によって検証されています。 条件付き GAN を使用したマテリアルリバースデザインの生成モデリングの概略図。 研究者らは、CGAN の使用に加えて、条件付き変分オートエンコーダ (CVAE) も新しい材料設計に使用できるが、トレーニング プロセス中に固有のノイズが注入され、再構築エラーに対して事前定義されたメトリックが必要であるため、VAE は GAN ほど効果的ではないとも述べていることも特筆に値します。 超伝導材料 超伝導材料は、ある温度において抵抗がゼロになる導体です。その応用範囲は広く、送電、電気機械、輸送、航空宇宙、マイクロエレクトロニクス、電子計算機、通信、原子核物理学、新エネルギー、バイオエンジニアリング、医療、軍事装備など、多岐にわたります。超伝導の発見以来、この分野は数々のノーベル賞を輩出しています。 高い臨界温度(Tc)を持つ新しい超伝導体の発見は、材料科学および凝縮系物理学において極めて重要な課題です。米国国立標準技術研究所(NIST)とマイクロソフトの研究者らは、独自の構造と化学組成を持つ超伝導体を生成するための新たな拡散モデルを提案しました。「データ駆動型ディープラーニングモデルを用いた次世代超伝導体の逆問題設計」と題されたこの研究は、*The Journal of Physical Chemistry Letters*に掲載されました。 論文の宛先: https://pubs.acs.org/doi/10.1021/acs.jpclett.3c01260 この研究で研究者らは、生成モデルを周期的材料に適用する際の主な課題は、並進と回転に対して不変な表現を作成することであり、この問題は結晶拡散変分オートエンコーダ (CDVAE) を使用して解決できると述べています。 DFT、ALIGNN、CDVAE 生成モデルを使用した新しい超伝導体の完全な逆設計ワークフロー。 そこで、上図に示すように、研究者らは1,058種類の超伝導材料のDFTデータを用いてCDVAEモデルを学習させ、3,000種類の新たな超伝導候補材料を生成しました。その後、学習済みのディープラーニングモデルALIGNNを用いてこれらの候補構造の超伝導特性を予測し、スクリーニングの結果、61種類の候補材料が抽出されました。最後に、研究者らはこれらの材料に対してDFT計算を行い、予測を検証するとともに、新材料の動的および熱力学的安定性を評価しました。下図は、有望な15種類の超伝導候補材料の構造を示しています。この研究により、この手法によって次世代材料のリバースエンジニアリングが可能になることが示されました。 CDVAE によって生成され、DFT によって検証された、最上位の超伝導候補材料 (凸包に最も近い) の上面図と側面図。 もちろん、上記以外にも、生成モデルは他のマテリアルデザイン分野にも応用されています。参考までにいくつか例をまとめてみました。 *リチウム電池設計 論文タイトル: 生成AIを用いた微細構造最適化によるリチウムイオン電池設計 論文の宛先: https://www.cell.com/matter/fulltext/S2590-2385(24)00446-6 *ナノ複合材料設計 論文タイトル: ナノ複合材料におけるカスタマイズされた機能性のための生成AI 論文の宛先: https://easychair.org/publications/preprint/sDm2 *2次元マテリアルデザイン 論文タイトル: ディープラーニング生成モデルを用いた新しい2D材料の計算的発見 論文の宛先: https://pubs.acs.org/doi/abs/10.1021/acsami.1c01044 *工学用セメント系複合材料の設計 論文タイトル: エンジニアリングセメント系複合材の性能ベースの設計のための生成AI 論文の宛先: https://www.sciencedirect.com/science/article/abs/pii/S1359836823004961 機械および生体模倣材料設計 論文タイトル: 生成AIアプローチによる機械的および生物学的にインスパイアされた材料の強化 論文の宛先: https://www.sciencedirect.com/science/article/pii/S2949822824001722 結論は現在、生成AIの材料設計への応用は、まだ実験段階にとどまっています。この技術を真に実現するには、計算による材料特性の評価に加え、現実世界の実験検証も不可欠です。そのため、計算によるスクリーニングと実験による新材料合成のギャップを縮め、人間の介入を最小限に抑えながら迅速に材料を発見するためには、自動化されたラボを構築し、閉ループ型の発見を実現することが特に重要になります。 カリフォルニア大学バークレー校のA-Lab自動化実験室を例に挙げると、実験手順を自動実行するだけでなく、データに基づいて自律的に判断を下すことも可能であり、17日間の連続運転で58種類の対象材料のうち41種類の合成に成功し、成功率は71%に達しました。これは、生成型AIを用いた材料設計と、自動化実験室による効率的な合成・検証が、材料科学の急速な発展を促進する効果的な手段になりつつあることを示しています。 参考文献: |
目標特性を持つ材料を直接設計しましょう!Microsoft の MatterGen モデルはオープンソース化されており、生成 AI による材料リバース デザインの新たなパラダイムを再定義します。
関連するおすすめ記事
-
人工知能アカデミー(AAI)は、2024 Embodied World Model Summit を主催し、産業界、学界、研究機関の連携を通じて技術革新と産業応用を促進しました。
-
物理学者によって初めて猫の運動方程式が解明されました! | American Journal of Physics に掲載された本格的な研究。
-
O1初の企画力テスト!言語モデルの域を超え、プレビューがついにミニに勝利!
-
智源ロボティクス、ロボットの4D世界モデルを公開
-
学生に大規模モデルに取り組まないようにアドバイスするヤン・ルカンのツイートをどう解釈すべきでしょうか?
-
ウルトラマン: オープンソースAIについて、私たちは間違っていました!DeepSeekがOpenAIの優位性を侵食しました。次はGPT-5です。