|
新たにノーベル化学賞受賞者となり、DeepMind の創設者でもあるデミス ハサビス氏の新しいインタビューが登場しました。 DeepMindの当初の意図と現在の取り組み、AGI、そしてAIの将来について話し合いました。 AGI に関しては、ウルトラマンは以前、5 年以内に登場してくる可能性があると述べており、マスク氏もすぐに実現すると予測していましたが、ハサビス氏はそれほど早くは実現しないだろうと考えていました。 彼は、AGI を実現するには約 10 年かかり、2 つまたは 3 つの大きなイノベーションが必要になると考えています。 さらに、人工知能を単なる技術の一つとみなすのは間違いです。人工知能はインターネットや他の技術よりもはるかに大きな影響力を持つでしょう。AIは「画期的な」、まさに「決定的な」技術となるでしょう。 ... ハサビス氏はまた、「DeepMindの目標は、創業当初から今日まで、AGIの実現であり続けている」と明言し、「DeepMindは研究主導の組織であり続ける」と述べた。 興味深いことに、ハサビス氏はどのようにして個人的に継続的な研究を続けているのかと尋ねられたとき、次のように答えました。 以前は深夜0時から午前3時まで読書や考え事をしていましたが、今ではその時間のほとんどを電話会議に費やしています。ですから、時間の使い方を考え直す必要があります。 つまり、ネットユーザーはインタビュー全体を心から楽しんだのだ。 ネットユーザーの中には熱心にメモを取っている人もいた。 重要なポイント:AGIはまだ10年先です。現在のAIブームは、エージェントにオンライン/オフラインのタスクを実行させることに注力しています。これがどのように進化していくかは、複数のAIエージェントを呼び出し、それぞれが特定のタスクを連携して実行するための、主要な汎用AIシステムの構築にかかっています。 しかし、一部のネットユーザーは異なる焦点を持っています。彼らの注目はコメント自体ではなく、むしろ以下の点にあります。 さっそく、QuantumBitはこのインタビューの内容を、原文の意図を変えることなく翻訳・編集しました。どうぞお楽しみください! インタビュー記録Q:起業の道を歩み始めたのは2010年頃ですね。当時、既にいくつかのアイデアをお持ちでしたが、AIは数十年にわたる停滞を経験しており、目立った進歩を遂げているようには見えませんでした。なぜその時期にDeepMindを設立することにしたのですか? ハサビス: 実は私は30年以上AIの研究に携わっています。 最初はゲーム業界で働き、ゲームAIやシミュレーションゲームの開発に携わりました。その後、コンピュータサイエンスと神経科学を学び、それ以来ずっとAI分野の発展を観察してきました。 1990年代、いわゆる「AIの冬」の時期には、主に論理システム、いわゆるエキスパートシステムが注目されていました。ディープ・ブルーがチェスのグランドマスター、ガルリ・カスパロフを破ったことを覚えている方も多いでしょう。エキスパートシステムは、プログラマーとシステム設計者が問題を解き、それをルールとして定式化する、事前にプログラムされたシステムでした。 しかし、コンピュータやAIシステムは実際には知的ではなく、単にこれらのヒューリスティックを機械的に実行しているだけです。問題は、これがシステムを脆弱にしてしまうことです。設計者やプログラマーが既に知っている知識によってその能力が明らかに制限されているため、新しいことを学習することも、新しいことを発見することもできません。 私にとって、1990 年代には、ケンブリッジ大学であれ MIT であれ、どこで勉強しても、論理システムが正しい方向であるという見方が主流でした。 AI は本質的に脆弱で限界があるため、これが AI 冬至の理由の 1 つであると私は考えています。 2010年、学術界におけるディープラーニングの出現により、私たちは新たな可能性を見出しました。また、脳内のドーパミン系も強化学習を利用していることも発見しました。人間を含む動物は強化学習を通じて学習するのです。 そこで、私たちが構築すべきは、自ら学習でき、普遍性を持つシステムだと理解したのが、 DeepMindの原点です。 GPUなどのハードウェアも急速に進化しています。GPUがコンピューターグラフィックスやコンピューターゲームに初めて使われ始めた頃から使い始めましたが、当時は非常に汎用的な用途でした。 世の中のあらゆるものは行列の乗算に還元できることがわかります。 したがって、私たちは早い段階で、これらの新しいアイデアとコンポーネントを統合するには、技術の進歩を急速に促進できるアポロ計画と同様の取り組みが必要であることを認識し、最終的にそれを達成しました。 Q:これが2010年にあなたが思い描いていた未来ですか?15年後、ここで大勢の聴衆にAIの重要性について語り、タンパク質折り畳み問題を既に解決していることを想像していましたか? ハサビス: 実際、すべてはほぼ計画通りに進みました。もちろん、途中で小さな挫折や予期せぬ出来事もありましたが、2010年にプロジェクトを開始した当初は、AGIの実現には約20年かかると考えていました。 この目標を達成するには、おそらく10年くらいかかると思います。 ということで、大体このタイムラインに沿って進みました。さらに、タンパク質の折り畳みと、AGIへの道筋における科学研究へのAIシステムの活用は、常に私の情熱でした。 タンパク質の折り畳みは、私が解決したい科学的問題のリストの中で常にトップに位置しており、もし突破口が見つかれば、それは革命的なものとなるでしょう。 Q: AGIについてお話ししましょう。興味深いことに、ChatGPTが登場して以来、AIについて多くの白熱した議論が行われていますが、これはあなたが取り組んでいるAIとは全く異なるものです。今のところ、観察者としては、あなたのAIは非常に具体的で、少し奇妙に見え、一見無意味なことをし始め、コンピューターゲームがとても上手になっているように見えます… ハサビス: 意味がないとは言いませんが、どちらかと言うと娯楽目的だと言えます。 私がゲーム開発やチェスなどの分野で経験を積んでいたこともあり、私たちはゲームから始めました。 チューリングの時代から、ゲームはAIの発展と密接に関係してきました。シャノンのような偉大な頭脳を持つ人々は、チェスプログラムから着手しました。これは、ほぼすべてのAIの先駆者たちが行ったことです。 チェスは AI システムのトレーニングの場と考えられています。 あなたのアルゴリズムのアイデアは急速に進歩できますか?自分の位置をベンチマークするのは簡単です。世界チャンピオンや最強のコンピューターに勝てば、それは素晴らしい成果と言えるでしょう。 しかし重要な点は、これらは常に目的を達成するための手段であり、目的そのものではないということです。 したがって、アイデアは常に進化するべきであり、囲碁やチェスの世界チャンピオンになるだけでなく、科学や商業への応用を含む他の分野に転用できる普遍的な方法で開発されるべきです。 これは、私たちが深層強化学習を使って行ったことであり、AlphaGoで行ったことでもあります。これらはすべて、現在でも使われている非常に一般的なシステムと技術です。 AlphaFold がタンパク質の折り畳みを解くような問題の場合、本当に興味深いのは、その解決策そのものです。 もし癌の治療法があったら、どんな治療法かなんて気にしないでしょう。ただ治療法が欲しいだけ。だから、治療法を手に入れるためなら何でも試すでしょう。 ですから、最初のステップは、既存の一般的な技術をすべてベースラインとして使い、それからドメイン自体を検証することです。そのドメインが社会やビジネスにとって十分に価値があるなら、そこに独自の要素を加えていくのです。こうして、AlphaFoldのような画期的なプログラムが生まれるのです。 結局のところ、 DeepMind の当初から今日までの目標は、AGI を実現することです。AGIとは、人間がすぐに実行できるあらゆる認知タスクを実行できる汎用システムを意味します。 1950年代にアラン・チューリングが定義したように、計算可能なあらゆるものを計算できる、完全に汎用的なチューリングマシン。これはAI分野の当初の目標であり、DeepMindの目標であり続けています。 もちろん、最近皆さんが目にしたのは、こうした言語モデルのようなものでしょう。ChatGPTは明らかに誰もが関心を持つ存在であり、実際、GoogleやDeepMindを含むトップクラスの研究室はすべて言語モデルの開発に取り組んでいます。 私たちはChinchillaと呼ばれる独自の内部モデルを持っており、Googleにも独自のモデルがあります。もちろん、これらはすべてGoogle Researchが開発したTransformerアーキテクチャに基づいており、これが現在のすべてのモデルの基盤となっています。 言語は明らかに普遍的なスキルであるため、これは刺激的な時代です。 だからこそ、誰もがチャットボットに興奮しているのです。このテクノロジーがこれほど広範囲に拡張できることは、興味深くもあり、驚きでもあります。 私たちはこのような普遍的なシステムの構築にこれまで以上に近づいていると信じていますが、特定の領域で最高レベルに到達するには、依然として専門的なシステムが必要です。 Q: LLMはAGIに近いのでしょうか?人間とのインタラクションに近いと感じますが、実際はどうなのでしょうか? ハサビス: 「大規模言語モデル (LLM)」という用語でさえ、現在のところ十分に正確ではないと思います。なぜなら、LLM は大規模言語モデルであるだけでなく、マルチモーダルでもあるからです。 例えば、私たちのモデルGeminiは最初からマルチモーダルです。そのため、画像、音声、動画、コード、テキストなど、あらゆる入力を処理できます。 これはAGIシステムの重要な要素になると信じていますが、それだけでは十分ではないかもしれません。AGIを実現するには、今後さらに2、3つの大きなイノベーションが必要になると思います。 だからこそ、私は10年という期間を提案しました。同業他社や競合他社の中には、より短い期間で事業を展開しているところもありますが、私は10年という期間が適切だと考えています。 Q:先ほどお話したタンパク質の折り畳みや天気予報など、現在、非常に実用的なプロジェクトに取り組んでいらっしゃいますね。最近、国際数学オリンピックで銀メダルを獲得されましたが、今後も努力を続ければ金メダルも獲得できるかもしれませんね。 他にも様々な活動を行っていますが、AGIの開発を継続的に推進していくための方策を、水面下で検討されているのでしょうか?専任のチームはありますか? ハサビス: 私たちは確かに大きな組織です。おっしゃる通り、私たちは元々、未来を創造し、長期的な計画を立てる能力を持つ、世界有数の産業研究所の一つであるベル研究所をモデルに設立されました。 私たちはこのモデルの有効性を実証し、特に今日目にするテクノロジーの基盤を築くことに成功しました。 したがって、ディープテック系のスタートアップは、技術の開発と成熟に時間をかける必要があると考えています。これらの技術はここ2、3年で大きく成熟し、幅広い分野への応用が可能な状態にあるため、私たちは今、非常にエキサイティングな瞬間を迎えています。 これには、科学、数学、医学などの分野の進歩だけでなく、チャットボットや再設計されたワークフローや電子メール システムなどの生産性およびビジネス アプリケーションも含まれます。 これらはすべてまだ初期段階にあり、私たちはそれらすべてに取り組んでいます。 Googleは15億人以上のユーザーに向けたサービスと製品を提供しており、その中心にはAIが存在していると考えています。常に新しい機能が追加されていますが、それらはすべてDeepMindで開発されている技術から生まれています。 ある意味、これは素晴らしいことです。なぜなら、この製品の技術的要件は、私たちが AGI に向けて行ってきた研究と約 90% 類似しており、これらの領域は大部分で収束しているからです。 5~10年前、製品にAIを組み込もうとすると、汎用システムや学習システムが不十分だったため、論理ネットワークやエキスパートシステムに頼らざるを得ませんでした。Alexa時代のアシスタントと同様に、AIは依然として古い技術に基づいており、脆弱で汎用性に欠け、結局のところあまり役に立ちませんでした。 新世代のアシスタントはさらに高性能になるので、実はとても楽しみです。 実際、Gemini のようなプロジェクトや、Astra プロジェクトなどの将来のマルチモデル アシスタントに関する私たち自身のビジョンが、AGI システムへの重要な道筋でその方向への研究を推進していると私は考えています。 Astra のデモビデオがあります: https://mp.weixin.qq.com/s/h1... これは、日常生活に役立つ基本的なオールインワンアシスタントのほんの始まりに過ぎません。今後は様々な形で提供される予定です。スマートフォンやメガネなどのデバイスで表示でき、その素晴らしさは言葉では言い表せません。 もし5年前に戻って、カメラを何かに向けるだけで周囲の空間環境を完全に理解できる段階に到達していると言われたら、それは本当に信じられないことでしょう。 まるで物体の概念を理解し、理解しているかのように、窓の外をちらりと見ただけで私たちの位置まで認識してくれます。物をどこに置いたかを記憶するメモリ機能やパーソナライゼーション機能も、アシスタントにとって非常に便利です。これらすべてが、私が次世代のアシスタント、つまりユニバーサルアシスタントと呼ぶものの一部です。 なぜなら、ゲームを一緒にプレイしたり、デスクトップでの作業を手伝ったり、モバイル デバイスで旅行に持ち出したりと、さまざまなデバイスを使用してどこにでも持ち歩くことになると思うからです。すべて同じアシスタントです。 Q:現在の進歩を AGI への一歩と見る人もいますが、現在のアプローチには克服できない固有の限界があると考える人もいます。 この進歩は目標への段階的なアプローチだと思いますか、それとも解決する必要がある他のより複雑な問題があると思いますか? ハサビス: こうしたシステムは確かに必要であり、皆さんもさまざまな高度なチャットボットを体験したことがあると思います。 これらのシステムは現在のところ比較的受動的で、主に質疑応答型のシステムです。質問に答えたり、基礎的な調査を行ったり、テキストを要約したりするのには大変便利です。 次に私たちが求めているのは、ユーザーが割り当てた特定のタスクを実行できる、より多くのエージェントベースのシステムです。これはまさに、休暇の計画、都市旅行のスケジュール、イベントチケットの購入など、効率的なデジタルアシスタントが提供すべき機能です。 したがって、これらのシステムは現実世界で行動し、計画を実行し、推論する能力が必要です。より優れた計画能力、推論能力、行動実行能力、より強力な記憶力、そしてより正確なパーソナライゼーションによって、システムがユーザーの好みを理解し、ユーザーの指示や好みを記憶できるようにする必要があります。これらすべての技術が不可欠です。 囲碁の世界チャンピオンを破ったAlphaGoのようなゲームプログラムの中には、計画と推論を必要とするものもありますが、これらはゲームという狭い領域に限られます。私たちはこれらの技術を、ご覧の通り周囲の世界を理解するGeminiのようなモデルに適用する必要があります。 しかし、ゲームの外にある混沌とした現実世界でどのように計画を立てるか、それが次に達成すべき大きな進歩だと思います。 Q:そのアシスタントも AlphaGo のチェスレベルに到達できますか? ハサビス: はい。 したがって、正確に言えば、研究コミュニティは現在この問題について非常に興味深い議論を行っており、2 つの解決策が考えられます。 汎用エージェント システムは、ロボットなどの物理的なハードウェア、計算機などのソフトウェア、あるいは他の AI システムなどのツールを使用できると考えられます。 例えば、人間の脳に似た汎用AIシステムを想定し、AlphaFoldやAlphaGoを呼び出してタンパク質を折り畳んだり、囲碁を打ったりすることができます。これらの機能はデジタルであるため、Geminiのような汎用脳システムに統合することも検討できます。 ただし、特定の情報でシステムが過負荷になる可能性があるため、これにはトレードオフが必要です。たとえば、チェスの情報が多すぎると、言語処理機能が低下する可能性があります。 これは未解決の研究課題です。これらのツールは、特定のコンテキストで汎用 AI が使用するためのスタンドアロン AI ツールとして保持するべきでしょうか、それともメイン システムに統合するべきでしょうか。 プログラミングや数学といった機能については、メインシステムへの統合がより効果的であり、システム全体のパフォーマンス向上につながる可能性があります。そのため、私たちは学習理論や子どもの発達に関する研究も進めており、どの機能が汎用ツールとしてメインシステムに統合するのが最適かをより深く理解しようとしています。 Q:ベル研究所のような研究機関になることを今も目指していますか? ハサビス: 私たちは研究主導の組織であり続け、それが Google DeepMind での私たちの仕事のやり方です。 しかし、Googleの他の部門と連携する、より大規模な製品供給グループを徐々に構築してきました。それでもなお、私たちは基礎研究を守り、製品ロードマップだけに左右されるのではなく、独自の研究ロードマップに沿って、より長期的かつオープンに考えることができるように努めています。 Q:あなた自身はどうやってこれらすべてを管理しているのですか? ハサビス: 昔は夜は自分のために時間を取っていて、その習慣をずっと維持しようとしてきました。夜型人間なので、たいてい深夜0時から午前3時の間に考え事をしたり、研究論文を読んだり、新しいアイデアを生み出したりしています。 しかし時が経つにつれ、私はロンドンに留まりましたが、カリフォルニアにはより大きなチームを抱えるようになりました。そのため、以前は思考に費やしていた時間の多くが電話会議に費やされるようになりました。そこで、この時間をどのように再構築するかを検討する必要がありました。 Q:あなたは、具体的なリスクは定義されていないものの、現実のリスクについて警告した公開書簡に署名した一人だと承知しています。希望と破滅の理論について、どのような見解をお持ちですか? ハサビス: この問題に関しては、どちらの側でも過剰な誇大宣伝が行われているように思います。 一方には、物事は必ずうまくいかないものだと信じる、いわゆる「災害派」がいます。もう一方には、これは単なるテクノロジーの一つだと信じる「ポリアンナ派」がいます。 モバイルインターネットの発展において、私たちは以前にもこのような現象を経験してきました。社会として、そして人間として、私たちは優れた適応力を備えているため、こうした変化は特に異常なことではありません。 しかし、私はこの見方が間違っていると確信しています。これはインターネットやモバイルインターネットといった技術よりもはるかに大きな影響を与えるでしょう。まさに革命的な定義です。 ますます多くの人がこのことに気づき始めていると思います。私も子供の頃からこの考えを抱いており、だからこそこの分野に人生を捧げてきました。これは大きな影響を与えると信じています。 もちろん、私の心からの献身は、AIが世界に極めてポジティブな影響を与えるという信念に基づいています。AIによって、私たちは近い将来、あらゆる病気を治し、材料科学や新エネルギー源を通じて気候変動問題の解決に貢献し、生産性を向上させ、生活を豊かにし、日々の業務を自動化できるようになるでしょう。 これらはすべて素晴らしいと思います。そして、それらはすぐに登場します。 しかし、これらのシステムにはリスクが伴います。新しいシステムであり、新しい技術であり、そして非常に強力です。私はゲームという縮図の中で、これを直接目撃しました。 例えばチェスを例に挙げましょう。AlphaZeroというシステムから始めると、朝はまだランダムな結果が出ます。朝のコーヒーブレイクまでに、既に私よりも上手になります。昼食時間までには、世界チャンピオンよりも上手になります。そして午後、8時間以内に、世界最高の固定プログラム可能なチェスコンピューターを凌駕します。 たった8時間で、ランダムな状態から世界最強のチェスプレイヤーへと変貌を遂げたというのは、実に驚くべきことです。私は実際にその過程を観察しました。 もちろん、それは単なるゲームであり、範囲は非常に狭いものでしたが、その能力をより一般的なシステム、言語、世界モデルに拡張できない理由はわかりません。 したがって、非常に強力ですが、慎重に取り扱う必要があります。 まだ分からないと思います。ですから、私があの手紙に署名したのは、「何も見るべきものはない」というポリアンナ主義に異議を唱えたかったからです。実際には未知のリスクがいくつか存在しており、それを定義する必要があります。まだ時間はあると思いますが、これほど重大な問題を考えると、 10年というのは決して長い時間ではありません。 したがって、これらのシステムの制御可能性と挙動を理論レベルで理解するための研究をさらに進める必要があります。また、これらのシステムの目標と価値をどのように定義し、それらの目標と価値をどのように遵守させるかといった、非常に重要な点もあります。 これらはすべて、新興技術における未知のものです。 ですから、私は慎重な楽観主義者だと言えるでしょう。私たちが団結し、国際的に協力し、最善の知恵を結集し、今すぐ行動を開始すれば、この問題を解決できると信じています。 ですから、私はただ、この実現を促しているだけです。十分な時間と知性があれば、正しく実現できると信じています。しかし、リスクは伴い、近道はできません。この技術には、相応の敬意と畏敬の念を払う必要があります。 なぜなら、私たちはこの技術の最前線にいるからです。 Q:おっしゃる通りで不安です。あなたが説明したシステムは、人間の価値を大きく置き換える可能性を秘めているように思えます。 ハサビス: そうは思いません。重要な哲学的な議論がこれから始まると思っています。これらの議論は間もなく展開されるでしょう。例えば、私たちはどのように活動範囲を広げるべきでしょうか? AGIが実現すれば、エネルギーなどの資源が不足することはなくなり、豊かな時代が到来するはずです。ですから、AGIは経済のダイナミクスを大きく変えることになると思います。 私が話しているのは長期的な視点です。ですから、私たちは今からこの問題について考え、準備を始める必要があります。例えば、その余剰の豊かさと富をどのように分配したいかを考え始める必要があります。 参考リンク: [1] https://x.com/GoogleDeepMind/... [2] https://x.com/tsarnick/status... |
最近のインタビューで、ノーベル賞受賞者のデミス・ハサビス氏は、AIを単なる技術として見るのは間違いだと述べた。
関連するおすすめ記事
-
クロードのチームは、清華大学出身の物理学の天才、ヤオ・シュンユを迎え入れることができて大喜びです!二人とも現在、大型模型製作に熱心に取り組んでいます。
-
BaiChuan Intelligent は、企業が「より効率的、より高速、より優れ、よりコスト効率の高い」大規模モデルを実装できるようにするためのワンストップ ソリューションをリリースしました。
-
AI が生成したコードは高速で優れていますが、信頼してよいのでしょうか?
-
Keras の作成者は Google を去りました。
-
COSCon'24 ボランティア募集のお知らせ: 一緒に新しいオープンソースライフスタイルを作りましょう!
-
Ruqi Mobility は、テクノロジーの反復のためのより優れたソリューションを提供する「データ クローズド ループ」を駆使して、インテリジェント ドライビングのより深い領域に進出しています。