618ZXW

Natureのサブジャーナルに掲載されました!華中師範大学は、AIを活用して分子断片を正確に分割し、44種類の薬物/農薬分子を生成するDigFragを提案しました。

過去数十年にわたり、フラグメントベース創薬(FBDD)は、標的タンパク質と弱い相互作用を持つ小分子フラグメントを特定し、これらのフラグメントの構造情報を最適化してより活性の高いリード化合物を開発することにより、新薬開発において重要な役割を果たしてきました。

FBDDは創薬開発において重要な役割を果たしていますが、効果的な分子フラグメントライブラリの構築とスクリーニングは依然として大きな課題となっています。従来のFBDD手法は経験的直感に依存しており、多様な構造を開発する能力に限界があります。幸いなことに、AIの出現は、この課題に革新的な解決策をもたらしています。

最近、華中師範大学の楊光富教授と王凡准教授のチームは、「DigFrag」と呼ばれるデジタルセグメンテーション手法を開発しました。この手法は、分子グラフ上の局所的な構造に焦点を当てることで重要な部分構造をハイライトし、それらをフラグメントに分割します。実験結果によると、DigFragで分割されたフラグメントは構造多様性が高く、これらのフラグメントに基づいて生成された化合物は、予想される化学的性質とよりよく一致することが示されました。これは、AI手法を用いて生成されたデータが、AIモデルのトレーニングと適用により適している可能性を示唆しています。

「人工知能ベースの医薬品設計に使用されるデジタルフラグメンテーション手法としてのDigFrag」と題されたこの研究は、国際学術誌「Nature Communications Chemistry」に掲載された。

研究のハイライト:

  • 研究により、DigFrag ベースのセグメンテーションと AI モデルを組み合わせることで、望ましい特性を持つ分子を効果的に生成できることがわかりました。
  • この研究では、精密なスクリーニングを通じて、最終的に 24 個の薬物分子と 20 個の農薬分子が特定されました。
  • チームは、さまざまなフラグメンテーション技術を統合して、より広範囲の分子分析および設計作業をサポートする、ユーザーフレンドリーなプラットフォーム「MolFrag」を開発しました。

論文の宛先:
https://doi.org/10.1038/s42004-024-01346-5

オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。

https://github.com/hyperai/awesome-ai4s

データセット: 約 3,000 種類の医薬品に関するデータを含む、独自に構築したデータベース PADFrag。

本研究で使用したモデリングデータセットは、主に自作データベースPADFragから取得しています。具体的には、PADFragデータベースには、主にDrugBankデータベースのFDA承認医薬品リスト(1,652種類の医薬品を含む)と、Alan Wood氏がリストアップした市販農薬(合計1,259種類)が含まれています。

*PADFragは、創薬のための生物活性フラグメントの空間を探索するために構築されたデータベースです。
https://pubs.acs.org/doi/10.1021/acs.jcim.8b00285

データの一貫性と信頼性を確保するため、研究チームは非標準的な構造を持つ化合物を除外しました。その後、データセット全体を8:1:1の比率でトレーニングセット、検証セット、テストセットに分割し、モデルのトレーニング、評価、テストを容易にしました。

DigFrag: 構造的多様性に富んだフラグメントを取得するための 3 段階のワークフロー。

DigFragは、グラフアテンションメカニズムを用いて薬物/農薬のフラグメントを識別・分割する革新的なデジタルセグメンテーション手法です。その主な利点は、人間の専門知識に頼るのではなく、機械知能の観点から問題にアプローチすることで、より構造的に多様なフラグメントを取得できることにあります。

さらに、本研究では、BRICS、RECAP、MacFrag、DigFrag の 4 つの方法でセグメント化されたフラグメントを DeepFMPO モデル フレームワークに統合して薬物分子を生成し、さまざまなメトリックでそのパフォーマンスを評価しました。

最後に、研究者らはさまざまな分子断片化技術に基づいて、分子のセグメンテーションをサポートするユーザーフレンドリーなプラットフォーム、MolFrag を開発しました。

具体的には、研究ワークフローは次の 3 つの部分で構成されます。

まず、AI ベースの断片化手法:この研究では、グラフ ニューラル ネットワーク (GNN) アーキテクチャに基づいて分子を断片化する DigFrag 手法を使用します。

AIベースの断片化手法

上図Aに示すように、研究者は分子グラフをG=(V, E)と定義します。ここで、Vは分子内の原子に対応するノード、Eは原子間の化学結合に対応する接続​​エッジを表します。このプロセスでは、グラフアテンションメカニズムに基づいて、まず元の分子グラフを一連のアテンションレイヤーに入力し、各原子の個別の埋め込み表現を取得します。次に、これらの原子埋め込みを集約して、スーパーノードとも呼ばれる統一ベクトルを形成します。最後に、アテンションレイヤーをさらに処理することで、フラグメント全体の埋め込み表現が得られます。

2番目に、Actor-Criticモデルのフレームワーク:下の図Bに示すように、デジタルセグメンテーションがフラグメントベースの深層生成モデルに与える影響をさらに明らかにするために、研究者はBRICS、RECAP、MacFrag、DigFragの4つの方法でセグメント化されたフラグメントを統合し、2次元分子生成用のオープンソースのフラグメントベース強化学習ツールであるDeepFMPOアーキテクチャを使用して研究を行いました。

*DeepFMPOは、化合物内のフラグメントを置き換えることで目的の化合物を取得するActor-Critic強化学習モデルです。

アクター・クリティック・モデル・フレームワーク

第三に、オンラインプラットフォームの構築:様々な分子断片化手法が存在するものの、使いやすいオンラインサーバーが不足しています。そこで、本研究では、図Cに示すように、様々な断片化手法に基づいたユーザーフレンドリーなプラットフォーム「MolFrag」を開発しました。このプラットフォームは、BRICS、RECAP、MacFrag、DigFragの4つの分子断片化手法をシームレスに統合し、様々なスキルレベルの研究者が利用できるようにしています。

MolFragプラットフォームアドレス:

https://dpai.ccnu.edu.cn/MolFrag/


オンラインプラットフォーム

研究結果: DigFrag フラグメントはより高い多様性を示します。

DigFrag セグメントには、回転可能なキーが多数あります。

本研究ではまず、薬物および農薬のフラグメントを正確にセグメント化するためのモデルを学習させました。次に、5分割交差検証を用いて、DigFragのモデル精度、曲線下面積(AUC)、およびマシューズ相関係数(MCC)を、従来の手法(RECAP、BRICS)および最先端の手法(MacFrag)と比較しました。下の表に示すように、薬物フラグメントの特性分布の点では、DigFragによってセグメント化されたフラグメントは、BRICSによってセグメント化されたフラグメントとより類似しています。


BRICS、RECAP、MacFrag、DigFrag法を用いた薬物フラグメントセグメンテーションの特性

下表に示すように、DigFragでセグメント化された薬物フラグメントの分子量と水素結合受容体の数はBRICSでセグメント化されたものと類似していますが、回転可能な結合の数はBRICSより多く、これはおそらく独自の環構造破壊機構によるものと考えられます。一方、農薬フラグメントに関しては、DigFragでセグメント化されたフラグメントの平均分子量はBRICSより低くなっています。

BRICS、RECAP、MacFrag、DigFrag法を用いた農薬フラグメントセグメンテーションの特性

DigFrag セグメントはより高い構造的多様性を示します。

本研究では、DigFrag法を従来の手法(RECAPおよびBRICS)および最新の手法(MacFrag)と比較し、セグメント化されたフラグメントの構造多様性を評価することに焦点を当てました。その結果、DigFrag法は、他の3つの手法と比較して、薬物および農薬由来のフラグメントをそれぞれ9.97%~21.37%、8.94%~15.20%という低い繰り返し率でセグメント化することが示され、独自のフラグメントを生成できることが示されました。一方、MacFrag法はBRICSおよびRECAP由来のフラグメントの大部分をカバーしており、完全に革新的なものではなく、むしろ従来の手法の拡張であることが示唆されました。

異なる方法で得られた薬物/農薬フラグメント間の反復回数

研究者らはt-SNEアルゴリズムを用いて化学空間分布を可視化しました。下図に示すように、DigFragはフラグメントクラスタリング比において非常に優れた性能を示し、特に類似度閾値0.4および0.6において高い構造多様性を示しています。

異なる類似度閾値における薬物および農薬フラグメントのクラスタリング比。注:クラスタリング比は、フラグメントセット全体の構造的多様性を直接反映します。

DigFrag ベースのモデルは、より高品質の分子を生成できます。

本研究では、MOSESベンチマークプラットフォームにおいて、様々な生成モデルの性能を比較しました。以下の2つの表のデータは、DigFragベースのモデルがフィルタースコア0.828を達成し、より高い安全性を示していることを示しています。これは、深層学習における断片化プロセスにおいて、毒性と安定性が包括的に考慮されていることに起因すると考えられます。

4つの深層生成モデルを用いた薬物および農薬分子の性能評価

下図に示すように、農薬分子の場合、DigFragモデルによって生成された分子フラグメントは、SMILESの有効性、新規性、骨格多様性、構造アラートの点で優れた性能を示しています。さらに、DigFragモデルによって生成された薬物および農薬の分子フラグメントは、平均定量評価分析(QED)および合成アクセシビリティ(SA)において他のモデルよりも優れた性能を示しています。

4つの深層生成モデルによって分割された代表的な分子フラグメントの品質

さらに、DigFragによってセグメント化された分子フラグメントは、分子量、QED、SA属性分布においてMOSESデータセットと最も高い類似性を示しました。これらの結果は、DigFragモデルがより高品質な分子を生成できることを実証するとともに、分子設計においてAIモデルがAI由来のデータを好むことを浮き彫りにし、この分野におけるAI技術の優位性を強調しています。

厳選された44種類の高効率、低エネルギーの薬剤および農薬分子

最終的に、精密なスクリーニングの後、研究では 24 個の薬物分子と 20 個の農薬分子を特定しました。これらはすべて、QED 値が 0.75 を超え、SA 値が 3 未満であり、結合自由エネルギーがドンペリドン (-10.7 Kcal/mol) やメソチアジン (-8.4 Kcal/mol) よりも低いという基準を満たしていました。

本研究では、これらの分子と標的との相互作用をさらに解析しました。下図に示すように、薬物分子はDRD2の活性ポケットに効果的に結合し、主要なアミノ酸残基と水素結合を形成することが明らかになりました。

生成された薬物分子と DRD2 の結合パターンは、AutoDock を使用して分析されました。

さらに、下図に示すように、農薬分子はアミノ酸残基との水素結合を介してHPPDに安定的に結合しています。得られた化合物は陽性対照と比較して異なる結合様式を示しており、異なる薬理作用機序の可能性を示唆しており、今後の研究に新たな方向性をもたらします。

AutoDock を使用して、HPPD による農薬分子の結合モードを分析しました。

医薬品研究における AI の応用は、ゲームのルールを変えつつあります。

現在、医薬品研究におけるAIの応用はますます高度化しています。ディープラーニングネットワークを通じて、AIモデルは複雑な生物学的データや化学構造を分析し、医薬品分子の活性と選択性を予測することが可能になります。

本研究で言及されている楊光富教授と王凡准教授のチームは、今年初めに農薬様特性を予測するためのマルチモーダルディープラーニングアーキテクチャモデル「Pesti-DGI-Net」を共同開発しました。このモデルは、分子記述子、分子画像、分子グラフという3つの分子表現を統合することで、化合物の農薬様特性を予測できます。その結果、Pesti-DGI-Netは複数の指標において優れた性能を示すことが示されました。
論文リンク:

https://doi.org/10.1016/j.compag.2024.108660

さらに、AIは近年、薬剤の有効性研究の分野で重要な研究成果を上げています。中国科学院上海栄養衛生研究所は最近、薬剤併用による相乗効果を予測するための2視点ディープラーニングモデル「JointSyn」を構築しました。その結果、JointSynは様々なベンチマークにおいて、予測精度と堅牢性の点で既存の最先端手法を上回ることが示されました。
論文リンク:

https://doi.org/10.1093/バイオインフォマティクス/btae604

AI技術は、薬剤の有効性予測への応用に加え、医薬品設計の最適化、毒性学および安全性評価、臨床試験の設計、患者選定など、複数の分野で重要な研究成果を上げています。薬剤の有効性研究におけるAIの応用は、医薬品開発のルールを根本から変える可能性を秘めています。継続的な技術進歩により、予測精度の向上、医薬品設計の最適化、開発コストと期間の削減を実現し、より安全で効果的な治療選択肢を患者に提供できる可能性があります。