618ZXW

材料科学界のAlphaFoldが登場!MicrosoftのAIモデルはNature誌で特集され、中国のチームと協力して新材料の発見にも取り組んでいます。

既知の材料の有限数を超えて、材料科学の AlphaFold が到来したのでしょうか?

ちょうど今、マイクロソフトの CEO サティア ナデラ氏が自ら、 MatterGen モデルが Nature 誌に掲載されたことを発表しました。このモデルは、現在知られている材料を超え、AI を使用して特定のニーズに合った新しい材料を発見する能力があることを実証しています。

これは、材料設計の分野における新たなパラダイムを意味します。

生成 AI を活用することで、材料の発見は従来のデータベース スクリーニングから、需要主導のプロンプトに基づく直接生成へと移行しました。

あるネットユーザーは即座に素晴らしい要約をしました。「これはまさに「材料界の AlphaFold」ではないでしょうか?」

論文によれば、従来の発見方法と比較して、MatterGen は安定した、独自の新しい材料を生成する割合を2 倍以上に高め、DFT の局所エネルギー最小値から生成される構造の精度を10 倍近く向上させることができるという。

これらの改良は、電気自動車、航空宇宙、電子チップなどのハイテク分野に大きな可能性を秘めています。

発表後、コメント欄には「素晴らしい」という声が溢れ、AIによって材料の発見が大幅に加速されるとの声が多く寄せられた。

一方、論文著者の一人であるTian Xie氏は、オープンソースコミュニティがこの技術をさらに探求できるように、チームはMatterGenのトレーニングおよび推論コードをMITライセンスの下で公開する予定だと付け加えた。

論文では、マイクロソフトと中国科学院のSIAT(深圳先進技術研究所)のチームも協力し、MatterGenを使用して新しい材料TaCr₂O₆を得ることに成功し、目標の20%以内の物性値を測定したとも述べられている点も特筆に値します。

これは具体的にどのように実現されるのでしょうか?

要約すると、MatterGen モデルの有効性の鍵は、その独自の拡散モデル アーキテクチャにあります。

画像拡散モデルと同様に、ランダムノイズのある材料構造から開始し、原子の位置、要素の種類、格子構造を徐々に調整して、設計要件を満たす材料構造が生成されます。

この普及プロセスにおいて、2 つの重要な要素について言及する価値があります。

1 つは等変数分数ネットワークであり、拡散プロセス (つまり、ノイズ除去プロセス) から元の結晶構造を回復する方法を学習する役割を担います。

具体的には、等変分数ネットワークはデータ内のパターンを学習し、原子の種類、座標、格子について等変分数を出力します。これらの分数は、現在の構造における各原子と格子パラメータの「ミスフィット」、つまり理想的な結晶構造からの偏差を表します。

ネットワークはこれらのスコアを計算することで、原子パラメータと格子パラメータを調整して構造内のノイズを減らし、安定した結晶構造に近づける方法をモデルに指示します。

具体的な操作は次のとおりです。

  • 原子の種類について: 物質の化学組成規則と対称性に基づいて、原子の種類の変更が合理的かどうかを判断します。
  • 座標の場合: 結晶の周期的境界条件と幾何学的特性に基づいて、拡散によって導入された座標偏差が補正されます。
  • 結晶格子に関して:結晶格子の対称性と材料の物理的特性を組み合わせることで、格子パラメータを調整し、生成された結晶格子構造を安定させ、要件を満たすことができます。

もう 1 つは、事前トレーニング済みのスコア ネットワークを微調整する役割を担うアダプタ モジュールです。

これは、モデルの各レイヤーに導入され、指定されたプロパティ ラベルに基づいてモデル出力を変更できる調整可能なコンポーネントです。

つまり、特定の化学組成、対称性、またはスカラー特性 (磁気密度など) の制約を持つ材料を生成する必要がある場合、対応する特性でラベル付けされたデータセットを使用してモデルを微調整できます。

ファインチューニングでは、スコアネットワークのパラメータが最適化され、モデルによって生成された構造が特定のタスクの要件をより適切に満たすようになります。このコンポーネントは、モデルの適用性を向上させるだけでなく、各タスクの特性を一から学習する必要がなくなることも意味します。

実際、Microsoftは1年前にMatterGenモデルをリリースしました。当時、Google DeepMindのGNoMEツールは220万通りの結晶構造の予測に成功し、学術界で激しい議論を巻き起こしました。

著者の一人であるTian Xie氏は、前回の研究と比較して、MatterGenモデルは大きな進化を遂げたと主張している。

全体として、性能指標は向上しました。新材料の合成に成功しただけでなく、その特性値と目標値との偏差は20%以内にまで低減されました。

一方、新しい構造マッチングアルゴリズムのおかげで、生成される安定した新規材料の割合は2 倍以上に増加しました。

さらに、マイクロソフトは公式ブログでユーザーに注意喚起した。

MatterGen モデルは、弊社の他のモデルである MatterSimと組み合わせて使用​​すると最適です。

材料発見の分野では、それぞれが独自の補完的な役割を果たし、研究者が新しい材料を設計および検証する方法を変革しています。

つまり、 MatterGen が解決策を提案し、MatterSim がさらなる予測を行います

MatterGenが可能な材料構造を生成すると、MatterSimは厳密な計算解析を用いてこれらの可能性をさらに予測します。MatterSimはふるいのように機能し、理論的に可能なものと実用的に可能なものから実現可能なものを選別します。

MatterSim モデルはディープラーニング テクノロジを組み合わせて、原子間の相互作用を学習することで、金属、酸化物、硫化物、ハロゲン化物などのさまざまな材料とそれらのさまざまな状態 (結晶、非晶質固体、液体など) を絶対零度から 5000 ケルビンまでの範囲、および標準大気圧から大気圧の 1000 万倍までの範囲でシミュレートするものと理解されています。

カスタマイズされた MatterSim モデルでは、元のデータのわずか 3% で、必要な実験精度のシミュレーションを実現できます。

次の質問は、「MatterGen の実際的な用途は何ですか?」です。

新しい材料TaCr₂O₆が合成されました。

この論文では、この点に関していくつかの典型的なアプリケーションシナリオについても言及しています。

例えば、対象となる化学システム内で物質を生成することなどです。

置換およびランダム構造検索 (RSS) と比較して、MatterGen はさまざまな化学システムで最も高い割合の SUN (安定、ユニーク、新規) 構造を生成しました。

さらに、このシステムは五方晶系(つまり、複雑さを反映して5つの元素から構成される系)において非常に優れた性能を示し、計算効率においても明らかな優位性を持っています。さらに、V-Sr-O(バナジウム-ストロンチウム-酸素)系においても、新たな構造が発見されています。

もう 1 つの例としては、目標とする磁気特性、電子特性、機械特性を持つ材料を設計することが挙げられます

ご覧のとおり、MatterGen は、ラベル付けされたデータの規模に関係なく、生成された材料特性値を磁気特性、電子特性、機械特性に関連する逆設計タスクのターゲットに向けてシフトすることができます。

さらに、 DFT 計算予算が限られているため、スクリーニング方法と比較して、極端なパフォーマンス制約を満たす SUN 材料をより多く見つけることができます。

最後に、この論文では、サプライチェーンのリスクが低い磁石の設計についても言及しています。

つまり、高磁力密度かつ低サプライチェーンリスクの磁石の設計を例にとると、MatterGenは目標値付近に分布する構造を生成します。磁力密度と低いハーフィンダール・ヒルシュマン指数(HHI)を併せて最適化することで、サプライチェーンのリスク要素を低減し、永久磁石材料に類似した実験的に合成された多くの構造を再発見することができます。

一方、MatterGen の有効性を検証するために、Microsoft チームは中国科学院の SIAT (深圳先進技術研究所) チームと協力して、新しい材料TaCr₂O₆を合成しました。

この材料は、MatterGenによって生成された高体積弾性率材料を複数回スクリーニングすることで得られました。実験的に測定された体積弾性率は169GPaで、設計値200GPaに対する相対誤差は20%未満でした。

この成果が広く採用されれば、バッテリー、燃料電池、その他の技術の設計に大きな影響を与えるでしょう。

要約すると、上記の調査に対する Microsoft の評価は次のとおりです。

MatterGen は、AI を活用した生成的材料設計の新しいパラダイムを導入し、既知の材料の限られたセットを超えた材料の効率的な探索を可能にしました。

どう思いますか?