Google は、テスト時のコンピューティングを使用して科学的発見を加速するために、優秀な AI 科学者のチームを結成しました。

CEOのサンダー・ピチャイ氏が個人的にこの研究を支持したこともあり、Googleの最新の研究は話題になっている。

科学者の「研究パートナー」となるAIコサイエンティストは、高度な推論技術を用いて大量の文献を統合し、新たな仮説を生成し、詳細な研究計画を提案することができるマルチエージェントAIシステムです。

重要な点は、このシステムが科学的発見を加速するために OpenAI o1/DeepSeek-R1 と同様のテスト時間計算を使用するという点です。

ピチャイ氏によれば、このシステムはすでに肝線維症の治療、抗菌薬耐性、薬剤の再利用などの重要な研究分野で初期成果を達成しているという。

さらに、この勢いを活かすため、Google は世界中の科学者を対象とした「Trusted Testing Program」を立ち上げ、現在応募を受け付けています。

さらに、謝辞リストを見ると、この研究には Google Research、DeepMind、Cloud AI チームなど Google 内のトップクラスのチームが結成されたほか、テストに参加した一流大学の科学者も含まれていることがわかります。

ネットユーザーが言っているように、AIエージェントはいつかノーベル賞を受賞するかもしれない。

文献レビュー/仮説策定/レポート – すべて一度に完了!

AI 共同科学者がどのように働くかを見てみましょう。

その目標は非常に明確です。科学者が研究テーマを文書で提供すると、複数の AI エージェントを使用して、新しい研究仮説、詳細な研究概要、実験計画を生成することです。

関与するインテリジェントエージェントには、以下のものが含まれますが、これらに限定されません。

生成: 新しい仮説やアイデアを提案する。
反省：生成された仮説を評価し分析する
ランキング：仮説の優先順位付け
進化：反復を通じて仮説を改善する
近接性: 既存の知識に近い、または関連する領域を探索します。
メタレビュー: プロセス全体を監視および最適化します。

これらのインテリジェントエージェントは、自動フィードバックを継続的に繰り返して、仮説を生成、評価、改善し、自己最適化サイクルを形成して、最終的に高品質の研究ソリューションを出力します。

科学者として、私たちは以下の方法で共同研究に参加できます。

たとえば、最初にシステムに大まかなアイデアや研究テーマ、指示を提供して、それらを改良することができます。また、AI の出力に自然言語のフィードバックを提供して、さらに調整を行うこともできます。

さらに、科学者は、ウェブ検索や専門分野の AI モデルなどの他のツールを使用して、研究の質をさらに向上させることができます。

両者の間の具体的なコラボレーションプロセスをさらに詳しく調べると、科学者が研究目標を提案した後、監督エージェントがタスクの割り当てを担当していることもわかります。

特殊なインテリジェントエージェント (赤いボックス、独自の役割とロジックを持つ)
科学者の意見とフィードバック（青いボックス）
システム情報フロー（濃い灰色の矢印）
エージェント間のフィードバック (エージェント内の赤い矢印)。

上記のように、AI 共同科学者システム全体の操作は比較的シンプルです。

科学的発見のためのテスト時間の計算

もちろん、この研究の主なハイライトは次のとおりです。

拡張テスト時間計算により、自己対戦、仮説的ランキング、および前述の進化プロセスなどの主要な推論ステップを含む推論機能が大幅に強化されます。

この研究では、AIの共同科学者がElo評価システムを使用して、科学的問題を解決する能力を測定し、向上させました。

具体的には、Eloレーティングは、競技者の相対的なスキルレベルを測定するために一般的に使用される動的な評価指標です。研究者たちは、GPQA（一般問題解決型質問応答）ベンチマークにおけるAIコサイエンティスト（青線）とGemini 2.0（赤線）の平均精度を比較しました。

結果は、Eloレーティングの高いシステムは、難しい問題を解く際に、より正確な回答を提供することを示しました。（正の相関関係）

これは、Elo 評価が科学的問題を解決する際の AI 共同科学者のパフォーマンスを予測および改善するための効果的な指標として機能できることを示しています。

次に、7 人のドメイン専門家が 15 のオープンな研究目標を選択し、対応する最適なソリューションを提案しました。

目標は、自動化された Elo 評価メトリックを使用して、これらの複雑な問題を解決する際の AI 共同科学者と他の最先端のエージェントおよび推論モデル (Gemini 2.0 Pro および推論バージョン、および人間の専門家) のパフォーマンスを比較することです。

結果は、AI 共同科学者のパフォーマンスが著しく優れていることを示しました。

さらに、AI システムが推論と改善に費やす時間が増えるにつれて、自己評価の質が大幅に向上し、特定の状況で問題を解決できない従来のモデルや人間の専門家のそれをも上回っています。

さらに重要なことは、研究目標の 11 のサブセットの分析に基づいて、専門家が AI 共同科学者が新規性と影響力の点で他のベースラインモデルよりも優れていると評価したことです。

科学的発見における AI 共同科学者の実際的な可能性をさらに評価するために、研究チームは一連のエンドツーエンドの実験室実験を実施しました。

これらの実験は、薬剤の再利用、新たな治療標的の特定、抗菌薬耐性の根本的メカニズムという3 つの主要な生物医学分野に焦点を当てています。

実験では、AI共同科学者は専門家からの指導とフィードバックを受けただけでなく、単純なものから複雑なものまでさまざまな研究シナリオをカバーしました。

では早速、達成された初期結果を見てみましょう。

まず、薬剤の再利用とは、既に他の疾患の治療に承認されている薬剤を新たな疾患の治療に利用する戦略です。このアプローチにより、医薬品開発期間の短縮とコスト削減が可能になり、効果的な治療を迅速に患者に提供することができます。

今回、研究者らは急性骨髄性白血病（AML）に焦点を当てました。AI共同科学者は、薬物の化学構造、薬力学、遺伝情報など、膨大な生物医学データを分析し、AMLに有効な既存の薬物を予測しました。

最終的に、AI共同科学者は3つの候補薬剤を提案しました。さらに検証を行った結果、提案された薬剤は複数のAML細胞株において臨床的に重要な濃度で腫瘍の生存率を阻害し、その有効性を実証しました。

薬物の再利用よりも複雑なプロセスである新たな治療標的の特定において、研究者は肝線維症に注目している。

肝線維症の治療は肝疾患研究の現在の焦点であり、効果的な治療標的を見つけることが重要です。

このプロセスにおいて、AI 共同科学者は、遺伝子発現プロファイル、タンパク質相互作用ネットワーク、既知の薬物のデータベースなど、大量の生物医学データを分析することで、肝線維症に関連する主要な分子と生物学的経路を特定します。

AI共同科学者が提案した潜在的な治療オプションの範囲、および従来の線維化誘発剤（ネガティブコントロールとして）と阻害剤（ポジティブコントロールとして）と比較すると、AI共同科学者が推奨したすべての薬剤は有望な活性を示しました（p値0.01未満）。

これは、これらの薬剤が肝線維症の治療に高い可能性を秘めていることを意味します。

最後に、3 番目の実験では、大量の遺伝子、タンパク質構造、薬物活性データを分析することにより、AI 共同科学者が細菌耐性の潜在的なメカニズムを特定し、予測できることもわかりました。

具体的には、膜を形成するファージ誘導染色体アイランド（cf-PICI）において、研究者らは AI 共同科学者の能力を活用し、さまざまな細菌種における cf-PICI の存在と機能メカニズムを調査しました。

AI共同科学者が、大量の生物学文献とデータを分析・統合することで、新たな仮説を独自に提唱しました。

cf-PICI は、さまざまなバクテリオファージの尾部と相互作用することで、宿主範囲を拡大する可能性があります。

この仮説は実験室での実験によって検証されました。

しかし、AI の共同科学者が一連の初期の科学的発見を達成した一方で、Google が彼らの限界も指摘していることは注目に値します。

文献レビュー機能、事実確認、外部ツールとのクロスチェック、自動評価技術、大規模評価はすべて、さらに改善する必要があります。

興味のある研究者やチームは今すぐ応募できます!

618ZXW

Google は、テスト時のコンピューティングを使用して科学的発見を加速するために、優秀な AI 科学者のチームを結成しました。

文献レビュー/仮説策定/レポート – すべて一度に完了!

科学的発見のためのテスト時間の計算

関連するおすすめ記事

ランダムにおすすめされた記事

人気のタグ