618ZXW

デモを一足先にご覧ください!分子レベルからゲノムレベルまでの予測と生成を可能にする基礎ゲノムモデル「Evo」がScience誌の表紙を飾ります。

AIは近年、生物学分野に大きな影響を与えています。スタンフォード大学の研究チームは、Arc研究所と共同で、DNA、RNA、タンパク質を含むマルチモーダルタスクにおいて、ゼロサンプル予測と高精度な生成を実現するゲノムベースモデル「Evo」を提案しました。

「Evo による分子からゲノムスケールまでの配列モデリングと設計」と題された関連研究が、Science 誌の表紙記事として掲載されました。


論文の宛先:
https://www.science.org/doi/10.1126/science.ado9336

論文の第一著者であるエリック・グエン氏は、Evo の成果について何度も更新情報を投稿し、研究チームのメンバーに繰り返し感謝し、「このような素晴らしいチームと一緒に仕事ができるのは本当に光栄です」と述べました。

論文によれば、 Evo は StripedHyena アーキテクチャを採用しており、80,000 個を超える細菌および古細菌のゲノム、および数百万の予測されたファージおよびプラスミド配列を含む 3,000 億ヌクレオチド トークンをカバーする大規模なゲノム データセットでトレーニングされており、長さが 1 メガベースを超える適切なゲノム アーキテクチャを持つ DNA 配列を生成できるという。

さらに、 70億のパラメータスケールと131,072トークンの最大コンテキスト長を備えたEvoは、コーディング配列と非コーディング配列間の複雑な共進化を明らかにし、CRISPR-Cas複合体やIS200およびIS605トランスポゾンなどの複雑な生物学的システムを設計できます

要約すると、ゲノム配列全体を予測、生成、設計できる Evo の能力は、生命科学に新たな理論的サポートを提供するだけでなく、遺伝子編集、創薬、病気の診断、農業などの分野での応用も期待されており、複数の分野にわたる画期的な研究開発に貢献します。

多くのネットユーザーはEvoのリリースに驚き、このモデルの具体的な応用に期待を抱いています。


Evoモデルの強力な機能をできるだけ早く体験していただけるよう、 HyperAI SuperNeural Tutorialセクションに「Evo:分子スケールからゲノムスケールまでの予測と生成」を追加しました。コマンドを入力することなく、クローン作成だけでワンクリックですぐに体験できます。

チュートリアルリンク:
https://go.hyper.ai/JpdUS

デモ実行中

  1. hyper.ai にログインし、「チュートリアル」ページに移動して、「Evo: 分子からゲノムスケールまでの予測と生成」を選択し、「このチュートリアルをオンラインで実行」をクリックします。

  1. ページがリダイレクトされたら、右上隅の「複製」をクリックして、チュートリアルを独自のコンテナーに複製します。

  1. 右下にある「次へ: コンピューティング能力の選択」をクリックします。

  1. ページがリダイレクトされたら、「NVIDIA RTX A6000」を選択し、ニーズに合わせて「従量課金制」または「日次/週次/月次」のいずれかを選択してください。「PyTorch」イメージを選択し、「次へ:レビュー」をクリックしてください。下記の招待リンクから新規登録された方には、RTX 4090を4時間分、CPUを5時間分無料でご利用いただけます。

HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください):

https://openbayes.com/console/signup?r=Ada0322_QZy7

  1. すべてが正しいことを確認したら、「続行」をクリックし、リソースが割り当てられるのをお待ちください。最初のクローン作成には約2分かかります。

  1. ステータスが「実行中」に変わったら、「ワークスペースを開く」オプションをクリックします。

  1. Jupyter ワークスペースに入った後、「README」ファイルをダブルクリックして、正式に Evo モデル実行ページに入ります。

効果のデモンストレーション

  1. Evoモデル実行ページに入ると、すべてのパラメータはデフォルトモードになっています。「2. モデルを起動し、関連パラメータを入力する」までスクロールダウンし、必要に応じてプロンプトパラメータの値を調整してください。プロンプトのデフォルト値は「ACGT」で、これはDNA塩基対(A、C、G、T)で構成される初期配列を表しています。この値を変更することで、必要に応じて異なるDNA配列を生成できます。

  1. 例えば、prompt のデフォルト値を AGCT に変更します。デフォルトのパラメータ値を調整した後、「再起動してすべてのセルを実行」オプションをクリックし、「再起動」を選択して実行します。

  1. しばらくお待ちください。[*]記号が数字に変わると処理は完了です。「2. モデルを起動し、必要なパラメータを入力します」の一番下に、生成されたシーケンスが表示されます。

  1. さらに、Evoモデルは生成されたDNA配列を解析し、コーディング配列と非コーディング配列間の共進化関係を学習することができます。また、DNA配列からタンパク質コーディング遺伝子を予測し、RNAシステムのコーディングスキームを設計し、生成されたタンパク質の折り畳み構造を予測し、最終的にそれらを画像として提示することもできます。

「安定した拡散チュートリアル交換グループ」を作成しました。ぜひご参加いただき、さまざまな技術的な問題について議論し、アプリケーションの経験を共有してください。

WeChat で Hyperai01 (WeChat ID: Hyperai01) を追加し、「SD Tutorial Exchange Group」とメンションしてグループ チャットに参加します。