|
近年、大規模モデルのトレンドは自然言語処理や画像生成といった分野を超えて拡大しています。中でも、ライフサイエンス分野の大規模モデルは、その高い技術的ハードルと高い応用価値から、間違いなく市場の注目を集めています。科学界と産業界は、医薬品開発、バイオ製造、医療保健といった分野における大規模モデルの活用に大きな期待を寄せています。 BioMap は、世界的なライフサイエンス基礎ビッグデータ モデルの先駆者として、10 月 27 日の第 3 回中国バイオコンピューティング カンファレンスで、新世代のライフサイエンス基礎ビッグデータ モデルである xTrimo V3 を正式にリリースし、業界にまったく新しい答えをもたらしました。 V2モデルは1,000億を超えるパラメータ数とタンパク質言語の理解という画期的な成果を基盤として、さらに2,100億のパラメータ数に拡張され、タンパク質、DNA、RNAを含む7つの主要なライフサイエンスモダリティをカバーしていると報告されています。これにより、ゲノミクス、細胞、システムのより広範な問題をモデル化できるようになり、遺伝子編集、標的探索、細胞制御、株改変、ライフサイエンス画像解析といったシナリオに新たな可能性をもたらします。 xTrimo V3の前編:4年の歳月をかけて制作された、冷たく輝く剣Besto Biotechは、生命科学分野における基礎的大規模モデルに注力する世界最古のプラットフォーム企業の一つとして、2020年の設立以来、この極めて難解な技術プラットフォームのブレークスルー達成に尽力してきました。生命科学分野における基礎的大規模モデルは、自然言語処理モデルと生物学的テキストを組み合わせた単なる垂直アプリケーションや垂直型「大規模モデル」ではありません。生命科学分野におけるアミノ酸や塩基といった高度に複雑な配列データに基づき、自然言語処理モデルとは概念的に類似しつつも技術的には全く異なる、基礎的大規模モデルのための基盤技術群の開発が必要です。Transformerからトレーニングフレームワーク、そしてさらに重要なデータセットや検証ループに至るまで、これらはすべて自然言語処理モデルとは全く異なり、より困難で、より最先端です。 生命科学の多様かつ特殊なタスクとどのように統合するか、複雑な生命科学のオミクスデータをどのように理解して調整するか、生命科学の法則を理解して基本マップを確立する方法、そして生命科学業界において元のデータの数百倍にもなる超大規模データセットをどのように構築するか。これらはすべて、基礎生命科学モデルの先駆者たちが過去 4 年間に直面してきた課題です。 ベストバイオテックは2022年と2023年にxTrimo V1とV2をリリースし、数千億パラメータを有する世界初の大規模ライフサイエンスモデルを実現しました。これは、膨大なタンパク質配列データを用いてトレーニングされた数千億パラメータのタンパク質モデルです。このモデルは、2番目に優れたモデルの8倍以上のパラメータ数を誇り、業界標準を上回り、数十のタスクで最先端(SOTA)レベルに達しています。特に、タンパク質構造予測などの主要分野において、前例のない精度と性能を達成し、数々の商業的および技術的ブレークスルーをもたらしました。さらに、大規模なシングルセルオミクスデータを用いた大規模シングルセルモデルは、多次元クロスモーダル技術の予備的検証を行い、複雑な生物のクロスモーダルモデリングの強固な基盤を築き、10を超えるターゲット発見および細胞分類タスクにおいて最先端(SOTA)レベルを達成しました。関連研究は、Natureサブジャーナルの表紙やトップクラスの学術会議で複数回取り上げられています。 xTrimo大規模基本モデルプラットフォームでは、200を超えるタスクモデルが最先端(SOTA)評価レベルを達成しており、ユニバーサルタンパク質、さまざまな立体構造の抗体、細胞療法、遺伝子療法など、医薬品開発の複数の分野に加え、ターゲット発見、プロセス最適化、合成生物学、バイオ製造、ライフサイエンスツールなど、多様な分野をカバーしています。大規模基本モデルの貢献は、単一の技術で最先端の問題を解決することではなく、数千億のパラメータと数兆のデータポイントからの知識を組み込むことで既存のモデルを強化し、多様でデータが不足し、一般化可能な課題に直面した際に、数十億年の進化樹から高次元の情報を提供することで複雑な問題を解決することにあります。 百度生物科技(Baidu Biotech)の200を超えるAIモデルは、20種類以上の最先端抗体や酵素の開発、そして10種類以上の革新的ターゲットの発見に貢献してきました。これらはすべて実験検証を経て、前臨床開発をはじめとする後続段階へと進んでいます。AIモデルを活用したハイスループットの自動ワークフローは、分子生成、実験検証、そして閉ループ反復まで、研究開発チェーン全体を網羅しており、パートナー企業の研究開発効率を大幅に向上させ、研究開発サイクルを短縮します。 現在までに、ベストバイオテックは、多国籍製薬企業、大手CRO、スタースタートアップ、国内外の研究機関など、世界300社以上の顧客にサービスを提供しており、合計20億ドルを超える潜在的な受注を獲得し、ライフサイエンス分野で一連の画期的な成果を共同で達成しています。 xTrimo V3: 完全なモーダル スイート。ライフ サイエンスにおける新たな疑問を探求するための強力なツールです。新たにリリースされたxTrimo V3プラットフォームは、DNA、RNA、タンパク質、細胞、低分子、生物視覚、生物知識テキストなど、生命科学における7つの主要なモダリティをカバーしています。新しいデータとアーキテクチャにより、既存の各モダリティが大幅に強化されています。「このバージョンはモダリティを完全にカバーし、生命科学における急速に進化する新しい分野や課題の探究ニーズをサポートします」と、百度生物科技の技術担当副社長である張暁明氏は述べています。「V2プラットフォームと比較して、V3はタンパク質分野での基盤を強化し、細胞分野での開発を継続するだけでなく、ゲノミクス、トランスクリプトミクス、複雑な細胞タスク、画像解析、テキスト解析へと拡張し、初期の分子研究開発から生産スケールアップ、そしてその後の実験解析に至るまで、AIモデリングプロセス全体をサポートします。」 xTrimo V3はパラメータ数が2,100億を突破し、世界最大のフルモダリティ生命科学モデルとしてのトップの地位を維持したと報じられています。特にタンパク質モデル分野では、世界初のMOE(Advanced Expert Hybrid)アーキテクチャを導入した生命科学モデルとなり、パラメータ規模は数千億に達しました。また、DNAモデルの配列長は128Kにまで向上し、超長鎖配列からの生命の解読が可能になりました。これらのアップグレードは、百度生命科学が基礎生命科学モデル分野において継続的に革新を続けていることを如実に示しています。 大規模基本モデルをどのように有効活用できるでしょうか?これらのモデルの恩恵を受けられるのは、生物学とAIの両方の専門知識を持つ最先端のチームだけでしょうか?Beston Biotechは、大規模モデルプラットフォームを用いて社内で効率的なモデリングを実現した後、より強力なツールチェーンと製品化能力を模索してきました。2023年3月、Beston BiotechはxTrimoを基盤としたAIGP(AI Generated Protein)プラットフォームをリリースしました。業界から「タンパク質を生成できるChatGPT」と称賛されているこのプラットフォームは、生命科学分野の研究者に便利なインタラクティブウィンドウを提供します。プログラミングスキルを持たない研究者でも、大規模モデルと数十種類のタンパク質関連タスクモデル、そしてそれをサポートするハードウェアおよびソフトウェアシステムを活用することで、革新的なタンパク質設計研究を行うことができます。 xTrimo V3 プラットフォームでは、ライフサイエンス AI モデル専用に設計されたモデル ツールチェーンもリリースされました。これには、さまざまなデータ シナリオとユーザー ニーズに対応するモデル ビルダー モジュール、モデルの管理とアセンブリをサポートするモデル ハブ モジュール、モデルの呼び出しと物理計算を高速化するモデル ブースター モジュールが含まれます。 「xTrimoプラットフォームを基盤としてカスタマイズされたタスクモデルを構築し、大規模モデルの機能を企業の個人データや特定のニーズと組み合わせることで、企業向けのカスタマイズされたAIツールを迅速に開発することが、V3プラットフォームの重要な特徴の一つです」と張暁明氏は説明した。「また、既存のモデルとモデルのカスタマイズ機能を組み合わせ、医薬品開発ソリューション、バイオ製造ソリューション、AI4LSプラットフォームソリューションなど、様々な業界向けにソリューションを提供しています。AIモデルとサポートサービスを通じて、企業のイノベーション加速、研究開発効率の向上、プロセスの最適化、そして研究室から市場への迅速な移行を支援します。企業は、大規模モデルの生産性向上による圧倒的な効果を直接体験し、業界の包括的なインテリジェント開発を促進することができます。」 BioMap (百图生科) についてBioMapは、グローバルなライフサイエンス基礎モデリングのパイオニアです。2,100億のパラメータを持つクロスモーダル生物言語モデルを通じて、タンパク質、細胞、生物系の基礎法則を解読し、少ないデータ量とコストでライフサイエンスタスク向けの高品質AIモデルを構築します。BioMapは、創薬、バイオ製造、ヘルスケアの分野で200以上の最先端(SOTA)モデルのパフォーマンスを達成し、世界中で300以上のユーザーにサービスを提供しており、顧客からの受注総額は20億ドルを超えています。AI駆動型タンパク質設計、AIターゲット発見、AI酵素設計などの分野で、ユーザーが数々のブレークスルーを達成するのを支援してきました。同社は、百度の創業者であるロビン・リー氏と、百度ベンチャーキャピタルの元CEOであるリウ・ウェイ氏によって共同設立されました。中核チームは、ノボノルディスクやSAPの元グローバル副社長を含む業界の幹部で構成されています。シリコンバレー、北京、蘇州、香港に研究開発センターを構え、2億ドル以上のベンチャーキャピタルから資金を調達しています。 企業ウェブサイト: https://www.biomap.com |
Besto Biotech は、ライフ サイエンスの大規模モデルにおける 2,000 億のパラメータ レベルを突破する先駆的な大規模ライフ サイエンス モデルである xTrimo V3 をリリースしました。
関連するおすすめ記事
-
AIoT年次会議の最新アジェンダが公開されました!学識者、専門家、業界リーダーの皆様がご参加を確定しています!この年次イベントは見逃せません!
-
1200℃の高温性能限界を突破!北京科技大学は機械学習を活用し、優れた室温延性を持つ24種類の耐火性高エントロピー合金を合成しました。
-
Manus のオープンソース OWL 偽造フレームワークのレビューと使用方法のチュートリアルがここにあります。
-
謎の「レッサーパンダ」モデルが一夜にして話題に:ランキングでFluxとMidjourneyを上回る
-
Intel と AMD が今世紀に向けて力を合わせます。AI と Lenovo のおかげ。
-
AlphaFold がノーベル賞を受賞。DeepMind CEO の受賞スピーチ: AI に取り組む最高の科学者は素晴らしい成果を成し遂げるでしょう。