|
タンパク質の機能は、その3次元構造に大きく依存しています。19世紀半ば、科学界ではタンパク質の構造は「鍵と鍵穴モデル」のように固定され、剛直であると一般的に考えられていました。つまり、タンパク質とリガンドの結合は、固定された3次元構造によって決定されるということです。しかし、ダニエル・コシュランドが酵素は基質に結合する際に構造変化を起こすという説を提唱したことで、この従来の考え方は揺らぎ始めました。 1980年代に分子動力学(MD)シミュレーションが登場し、計算論的な観点から初めてタンパク質の軌跡が明らかになりました。それ以来、タンパク質の動的構造の機能的役割はますます注目を集めています。バイオテクノロジーの研究者や科学者にとって、タンパク質の「動き」の動的特性を理解することは、生命プロセスの理解や新薬の開発において非常に重要です。 例えば、Gタンパク質共役受容体(GPCR)は多くの薬剤の主要な標的であり、現在FDA承認されている薬剤の30%以上を占めています。しかし、GPCRは剛体構造ではなく、非常に動的な構造であり、異なるコンフォメーション状態が薬剤の結合様式に影響を与えます。静的な結晶構造のみに基づいて薬剤を設計すると、重要な結合部位を見落とし、薬剤親和性と選択性が不十分になる可能性があります。動的構造予測は、生理的条件下でのGPCRの複数のコンフォメーションを特定するのに役立ちます。これにより、低分子薬剤の設計を最適化し、標的療法の成功率を向上させることができます。 このような背景の下、復旦大学と上海智能科学研究所の朱思宇教授と斉元教授率いる研究チームは、南京大学の姚姚教授と共同で、分子動力学シミュレーションデータを組み合わせて動的なタンパク質構造を学習する革新的な4D拡散モデル「AlphaFolding」を提案しました。これは、複数の時間ステップにわたるタンパク質の軌跡を同時に予測できる、拡散モデルに基づく初の手法です。 ベンチマーク データセットでの検証結果では、新しいモデルが最大 256 個のアミノ酸を含み 32 の時間ステップにわたる動的な 3D 構造を高い精度で予測し、定常状態での局所的な柔軟性と大幅な構造変化を効果的に捉えていることが示されています。 「参照および動作ガイダンスによる動的タンパク質構造予測のための4D拡散」と題された関連する研究成果は、最高峰の国際会議AAAI 2025に採択され、プレプリントがarXivで公開されました。 論文の宛先: https://arxiv.org/abs/2408.12419 オープンソース プロジェクト「awesome-ai4s」は、200 を超える AI4S 論文の解釈をまとめ、膨大なデータセットとツールを提供します。 https://github.com/hyperai/awesome-ai4s タンパク質の動的構造を予測する研究には、まだギャップが残っています。AlphaFoldingモデルは、構造生物学研究における大きな進歩と言えるでしょう。タンパク質などの生体高分子の構造、運動、相互作用を研究することで生命現象を解明する構造生物学は、現在、分子生物学の主流となっています。 近年、ディープラーニング技術の進歩と、タンパク質データバンク(PDB)における実験的タンパク質構造データの爆発的な増加が相まって、タンパク質構造予測の分野において数々の重要なブレークスルーがもたらされました。中でもAlphaFold2は、最先端の人工知能アルゴリズムを用いて、実験に近い精度でタンパク質構造を予測する点で、おそらく最もよく知られています。この成果は、Science誌によって2020年の科学における10大ブレークスルーの1つに選ばれました。 偶然にも、2021年7月、ワシントン大学のデイビッド・ベイカー氏のチームが開発したRoseTTAFoldは、わずか10分強で特定のタンパク質配列の3次元構造を解明できる「3トラック」ニューラルネットワークを構築しました。 さらに、大規模データリポジトリの利用可能性は、タンパク質の立体構造サンプリング研究の発展を促進しました。例えば、Microsoft Researchは、平衡状態にある分子構造の分布を予測するためのDistributional Graphformer(DiG)と呼ばれるディープラーニングフレームワークを開発しました。従来の分子動力学シミュレーションや拡張サンプリング法は分子の平衡分布を得ることができますが、これらの手法は計算コストが高く、時間がかかるため、複雑な現実世界のシナリオに適用することが困難です。一方、DiGはディープラーニング技術を用いて、現実的で多様な立体構造を迅速に生成します。 タンパク質の構造と立体構造の予測における大きな進歩にもかかわらず、動的構造の研究は依然として比較的遅れています。例えば、AlphaFold2はタンパク質の3次元構造を正確に予測できますが、ある瞬間におけるタンパク質の静的な構造しか予測できず、動的な変化を予測することはまだできません。 2024年5月、DeepMindはアップグレード版AlphaFold3をリリースしました。これは、タンパク質、核酸、その他の低分子の3D構造を含むあらゆる生体分子の構造と相互作用を、かつてない「原子レベル精度」で予測し、それらがどのように結合するかを解明することができます。しかしながら、生体分子の動的な3D構造の予測には依然として大きな限界があります。 したがって、本研究で提案された革新的な4D拡散モデルは、この研究ギャップを埋めることを目指しており、タンパク質構造の動的特性に焦点を当て、タンパク質機能のより深い理解のための新たな知見を提供します。研究者らは、高品質の分子動力学(MD)シミュレーションデータを最大限に活用し、数百個のアミノ酸からなる複雑なタンパク質に適用可能な、完全な側鎖表現を含む動的なタンパク質構造を生成しました。これにより、MDシミュレーションの適用範囲が拡大し、より大規模で複雑なタンパク質系の動的挙動を予測できるようになり、タンパク質のダイナミクスに関する理解が深まります。 複数の時間ステップにわたるタンパク質の軌跡を予測する際に高い精度を示します。静的タンパク質モデルの構築は比較的容易ですが、動的タンパク質モデルはどのように表現すればよいのでしょうか?この問題に対処するため、研究者らはAlphaFold2のフレームベースのタンパク質構造表現手法を採用し、それを時間軸に拡張して、時間の経過に伴う構造変化を記述しました。 静的タンパク質モデリングでは、タンパク質は一連のアミノ酸残基から構成され、各残基はバックボーンフレームワークによってパラメータ化されます。一方、本研究では、動的タンパク質を、S時間ステップでバックボーンフレームワークが変化するN個のアミノ酸残基を含むシステムと定義します。これらのフレームワークは、局所フレームワークと全体参照フレームワークの向きを維持するために、特殊なユークリッド変換を用いて変換されます。 タンパク質中の追加の原子座標はすべて、化学構造の完全性を確保するために、ねじれ角への依存性に基づいて剛体グループに編成されます。各剛体グループ内では、すべての原子の相対的な位置と向きは変化しません。変換パラメータを組み込むことで、このモデルは時間経過とともに、理想的な実験座標からすべての原子の位置を再構築できます。 これに基づいて、下の図は研究モデル全体を構築する方法を示しています。拡散モデルは参照構造と対応するアミノ酸残基配列を入力として受け取り、ノイズ除去された一連の 3D タンパク質構造を出力として生成します。 研究方法の概要 研究者らは、3D構造埋め込みツールとGeoFormerを用いて、それぞれ3Dタンパク質構造と残基配列を埋め込みました。不変点アテンション(IPA)は、残基の明示的なフレーム情報を組み込むことでノードの特徴を更新します。 リファレンスネットワークとモーションアライメントモジュールは、参照3Dタンパク質構造に基づいて3Dタンパク質動的配列を捕捉します。生成モデル全体はスコアベースの拡散モデルとして構築され、ノードとエッジの特徴埋め込みはそれぞれEdgeUpdateモジュールとBackboneUpdateモジュールによって更新されます。 モデルを構築した後、研究者らは、ATLAS や Fast-Folding Proteins などのデータセットを使用して、提案されたフレームワークを現在の短期から長期 (S2L) タスクの DFF および Flow-Matching と比較しました。 結果は以下の表に示されています。ATLASデータセットのS2Lタスクでは、提案手法によりR32誤差が4.60から2.12に減少し、長期予測の精度が大幅に向上しました。また、Fast-FoldingデータセットのS2Lタスクでは、提案手法によりR32誤差が5.48から4.39に減少し、優れた長期予測能力を示しました。さらに、提案モデルはO2OタスクにおいてS2Lタスクと同等の性能を示し、優れた一般化能力を示しています。 DFF、FM、および本研究で提案された方法を使用した ATLAS タンパク質データセットの Cα-RMSE の比較。 DFF、FM、および本研究で提案された手法間での、Fast-Folding タンパク質データセットにおける Cα-RMSE の比較。 さらに、この手法は、シミュレーション時間が長く、各軌跡ステップでダイナミクスがより大きく変化するタンパク質を扱うことができます。実験結果は、この手法がタンパク質の運動学モデリングにおいて有効であることをさらに検証しています。 さらに、研究者らは可視化モデルを用いて最初の2つのTIC(時間一貫性成分)についてタンパク質の動的分布を生成し、実際のデータと比較しました。下図に示すように、新しいモデルはタンパク質の動的挙動を効果的に予測し、実際の分布と高い整合性を示しました。 最初の2つのTICコンポーネント上の異なるタンパク質のサンプル分布
下の図は、選択された時間ステップにおける逆拡散過程を示しており、ノイズ除去プロセス中にタンパク質構造が徐々に一貫性を増していく様子が強調されています。提案手法はタンパク質の動態を効果的に捉え、妥当な軌跡を生成していることがわかります。 初期ノイズ (左) から逆拡散によるタンパク質構造の段階的な形成 (右) までのプロセスを視覚化したものです。
タンパク質構造の動的特性はより注目されるようになるでしょう。タンパク質は細胞環境において静的な存在ではなく、複雑な動的変化を起こします。従来の静的構造予測手法は、タンパク質のフォールディングや相互作用の解明において大きな進歩を遂げてきましたが、タンパク質の動的な挙動を完全に捉えることはできません。そのため、動的タンパク質構造予測は構造生物学および計算生物学における最先端の課題の一つとなっており、近年、この分野に注力する研究者が増えています。 2022年12月、西湖大学の李自青氏率いるチームは、厦門大学および徳瑞製薬と共同で、タンパク質の構造変化を特徴づけ、親和性を予測できるAIモデル「ProtMD」を開発した。これは、タンパク質の動的構造解析を試みた初のAI手法である。薬物分子と標的タンパク質を与えると、ProtMDは、生体内で薬物分子が標的タンパク質に結合した後のタンパク質構造の変化を予測し、薬物と標的タンパク質の結合の安定性を推論し、薬物の機能を予測することで、AI薬物設計の精度と効率を向上させ、前臨床薬物開発を加速させる。 「薬物結合のためのコンフォメーション柔軟性を備えた等変グラフマッチングネットワークの事前トレーニング」と題された関連する研究成果が、Advanced Science に掲載されました。
2024年8月、コネチカット大学による新たな研究で、タンパク質の動的特性と結晶化傾向を正確に予測できる高度な計算モデルとツールが発表されました。「タンパク質のダイナミクスがタンパク質構造を形作る:タンパク質結晶化傾向に関する学際的研究」と題されたこの研究成果は、材料科学誌「Matter」に掲載されました。この研究は、タンパク質の自然な運動と波のような性質、つまり「ぐらつき」が、その機能特性、特に高品質結晶を形成する能力にどのように影響するかに焦点を当てています。 2024年10月、上海交通大学の鄭双佳教授の研究グループは、StarPharma、中山大学薬学院、ライス大学と共同で、動的タンパク質ドッキング向けに設計された幾何学的深層生成モデル「DynamicBind」を提案しました。このモデルは、タンパク質の立体構造を初期のAlphaFold予測状態からホロのような状態へと効果的に調整することができ、ポストAlphaFold時代の医薬品開発において、タンパク質の動的変化を考慮した深層学習に基づく新たな研究パラダイムを提供します。 「DynamicBind: 深層等変生成モデルによるリガンド特異的なタンパク質-リガンド複合体構造の予測」と題された関連研究が Nature Communications に掲載されました。 *クリックして詳細レポートをご覧ください:動的タンパク質ドッキング予測を実現!上海交通大学、星耀科技大学、中山大学などが共同で、幾何学的深度生成モデルDynamicBindを発表。 結論として、動的タンパク質構造予測は生命プロセスの理解に役立つだけでなく、医薬品開発、疾患メカニズム研究、そして産業バイオテクノロジーにおいても重要な役割を果たします。GPCR創薬設計やタンパク質間相互作用から酵素触媒やタンパク質凝集病理学に至るまで、動的構造予測は今後も生命科学の最前線を牽引し続けるでしょう。 参考文献: |
AlphaFoldingは、タンパク質の動的構造予測におけるギャップを埋めます!復旦大学らが4D拡散モデルを提案し、その成果がAAAI 2025に選出されました。
関連するおすすめ記事
-
Qualcomm 社が最も強力なスマートカー チップをリリース: インテリジェントなコックピット運転のための統合アーキテクチャ、標準的なエンドツーエンド構成、メルセデスベンツと Li Auto が最初に採用。
-
AIがMWCを席巻し、中国メーカーの「目を引く秘密」を暴露(doge)
-
手のひらサイズのチップが世界のコンピューティング能力を支配します。Microsoft の量子コンピューティングのブレークスルーにより、新たな物質状態の構築が可能になります。
-
初のAI科学者が登場!彼は独自に10本の学術論文を作成し、さらにはAI査読者まで誕生させました。
-
3 つの大型モデルがチームを組んで O1 に挑戦しました。実際のテストでは、360 を超えるモデルが協力してプロンプト ワード プロジェクトを排除しました。
-
インテリジェンスの世界を実現する | Google と共に開発者コミュニティを構築する