618ZXW

李菲菲の最新インタビュー:AIの10年、彼女が見る世界

データホエール

Datawhaleのヒント

インタビュー:CHM Live、編集者: Datawhale

最近のCHM Live番組では、「AIのゴッドマザー」として知られるフェイフェイ・リー教授が「フェイフェイ・リーのAIの旅」と題したインタビューに応じ、人工知能の歴史、現状、将来の発展の方向性について探求しました。

Datawhale は、元の意味を変えずに、次の翻訳と構成を提供しました。

AIの発展:人工知能の基礎から現代の革命まで

李菲菲氏は、人工知能の歴史的タイムラインに対話の焦点を当てました。

人工知能という用語は、1956 年のダートマス夏季会議から生まれました。

フェイフェイ・リー:彼らはこの問題をどう解決するかについて議論しました。推論と演繹に焦点を当て、機械に人間のように考えさせ、質問に答えさせ、判断させようと試みました。70年にわたる道のりで、私たちは浮き沈みを経験してきました。

それ以来、多くの誇大宣伝サイクルがありました。

たとえば、1970 年代には、ロボットが世界を支配するというテーマが雑誌の表紙に載っていました。

しかし、1990年代にこの分野で静かな革命が起こり始めました。

統計モデリングとコンピュータプログラミングの組み合わせによって、機械学習が登場しました。機械学習は、自然言語処理、コンピュータビジョン、音声認識といった分野を開拓しました。

フェイフェイ・リーが 2000 年代初頭にカリフォルニア工科大学で博士号取得を目指していたころ、彼女の世代の AI 研究者を定義する 2 つの出来事がありました。

統計的機械学習とインターネット。

Fei-Fei Li の ImageNet プロジェクトは画期的な出来事でした。ここで、AI の最近の歴史に触れたいと思います。

膨大な ImageNet データセットをオープンソース化することで、 Fei-Fei Li 氏とその同僚は人工知能の研究を進歩させました。

フェイフェイ・リー: AlexNetは、ニューラルネットワーク、ビッグデータ(ImageNetを使用)、GPUコンピューティングという現代のAIの3つの基本要素を初めて統合した、人工知能の世界を象徴する存在です。ImageNetが登場する前は、データの重要性は誰も信じていませんでした…

当時、研究には限られたデータが使用されていましたが、このパラダイムシフトによりそれらはすべて破棄され、人工知能の高容量モデルと一般化の開発が推進されました。

李菲菲:これは非常に革新的なアイデアですね。私たちは、これら全てを捨て去り、モデルをデータで満たし、データ駆動型の手法によって大容量モデルを推進したいと考えています。

しかし、彼女の粘り強さと情熱は報われました。先駆者たちやテクノロジー企業への扉が開かれ始めたのです。

李飛飛氏は、2010年か2012年頃から人工知能の現代ルネサンスの時代に入ったと考えています。

2016 年 1 月、人工知能が複雑な囲碁のゲームで人間に勝利したとき、人々は、機械がいくつかの特殊なタスクで人間に挑戦できるほど強力になり得ることに気づき始めました。

フェイフェイ・リー: AlphaGoとChatGPTの認知度の違いは、影響を受ける人の数だけではありません。人工知能がこれほど個人ユーザーによって厳密に制御されるようになったのは初めてです。AlphaGoは囲碁の達人以外にはアクセスできませんでしたが、ChatGPTは簡単にアクセス可能です。

過去 10 年間、一般の人々は一連の個別の出来事を目にしてきましたが、私たちはすべてを継続的なプロセスとして見てきました。

AIと社会:人工知能の発展と技術的展望

社会では、機械学習におけるバイアスやその他の懸念事項について議論が始まっています。

そして、2022年10月にChatGPTが登場しました

誰でも簡単に AI を利用できるようになったため、これはすべての人にとって目覚めの瞬間です。

突然、人工知能には強力な学習パターンと予測能力があることが人々にわかるようになりました。

また、ある程度の推論能力も備えており、「なぜ」を説明することができます。

李飛飛氏は、人工知能がさまざまな分野で問題解決に活用され始めるため、今後3~5年は刺激的な年になると考えています。

フェイフェイ・リー:まず第一に、私は人類の歴史において、テクノロジーと科学には限界があり、私たちは常にその限界を押し広げることができると根本的に信じています。個人的には、言語を超越する空間知能に非常に期待しています。

李飛飛氏は、AI が新たな分野に新たなデータをもたらすと信じています。

彼女は個人的に、人工知能は空間知能の発達に大きな可能性を秘めていると考えています。空間知能は、AIが現実世界を理解することを可能にします。

李菲菲:人間や動物の知能を見てみると、言語は知能の一部に過ぎません。人類文明の確立は、言語を超越する多くの要素に基づいています。ピラミッドの建設から第一次産業革命における複雑な機械設計、DNA構造の発見、映画製作の創造に至るまで、これらすべては言語を超越する空間知能の上に築かれています。

では、空間知能は AGI の始まりなのでしょうか?

初期の AI の先駆者たちの夢は、本当に人間のように考えることができるコンピューターを開発することでした。

科学的な観点から、李菲菲はこの夢を追求すべき目標と見ています。

しかし、彼女は AI が人間と同じ知能や、人間と同じくらい複雑で洗練された存在になれるとは思っていない。

AIと人間性:人間中心の人工知能イニシアチブ

AIが私たちの生活、ビジネス、そして世界に甚大な影響を与えるという認識は、背筋が凍るような思いです。ツールがこれほど強力になり得ると考えると、本当に恐ろしいです。

私たちはその影響、つまり人間の影響に根ざした重大な影響を考慮する必要があります。したがって、人間中心の枠組みの中で人工知能に取り組む必要があります。

フェイフェイ・リーは、スタンフォード大学の人間中心 AI 研究所の取り組みが、このテクノロジーとそれが人々の生活にどのような影響を与えるかを考える上で重要な枠組みを提供していると考えています。

Fei-Fei Li は人間中心の人工知能フレームワークを持っています。

フェイフェイ・リー:現在、スタンフォード HAI では、個人、コミュニティ、社会という 3 つの同心円から人工知能が人類に与える影響を考えています

人工知能は人類に、良い面でも悪い面でも大きな影響を及ぼします。

さまざまな分野の専門家が AI をそれぞれの領域に適用しようとすると、無数の肯定的な使用事例を探索することができます。

フェイフェイ・リー:学生にとって、この学際的なアプローチを受け入れることは重要です。将来を見据えると、人工知能はコンピューティングの新しい言語となります。以前も申し上げましたが、チップがあるところには必ず人工知能が存在する、あるいは存在するでしょう。電球のような小さなデバイスにも人工知能が搭載されるでしょう。ですから、恐れることはありません。自分の視点から人工知能を受け入れ、前向きな変化をもたらすために活用してください

AIとさまざまな分野を組み合わせることで生まれる多分野的、学際的な可能性に対する彼女の情熱にもかかわらず!

しかし、AIには多くのリスクもあると彼女は言いました。

李飛飛氏は、AIに関する無知が最大のリスクだと考えている。

フェイフェイ・リー:この技術について無知すぎると、それを活用する機会を逃してしまいます。また、この技術について無知であれば、実際のリスクを見極めることもできなくなります。さらに、無知な情報を拡散すれば、国民や政策立案者を誤解させてしまうことになります。

李菲菲は、人工知能はすべて良いものだと言う人は過去を知らないと述べた。

フェイフェイ・リー:人間と道具の歴史を振り返ると、あらゆる道具は有害な方法で使われてきました。ですから、使用しているデータセットに偏りがあれば、公平性に非常に悪い影響を与えることを認識しなければなりません。

しかし、人工知能はデータセンター内に存在し、人間社会と密接に結びついた物理的なシステムでもあります。

健全なAIエコシステムの構築と維持は、私たちにかかっています。これには、学界、スタートアップ企業、大規模および小規模のテクノロジー企業、そして特に公共部門の投資と支援が含まれます。なぜなら、公共部門の投資の最大の成果は、開発を支援する技術ではなく、人材だからです。

インタビュー余談

トム:では、ジェフリー・ヒントンはいつ人工ニューラルネットワークの研究を始めたのですか?

フェイフェイ・リー:約10年になります。彼はカーネギーメロン大学、あるいはそれ以前から在籍していました。あなたが挙げた例はすべて公共部門のものです。今後3~5年の間に、科学的発見について語るとき、刺激的な成果が見られるでしょう。その多くは公共部門から、そして最も優れた成果は公共部門の学術界から生まれるでしょう。何だと思いますか?これらの成果の源は人です。だからこそ、公共部門への投資が必要なのです。

トム:素晴らしいですね!とても聡明な方々ばかりなので、きっと良い質問がたくさんあると思います。例えば、御社の新しい会社についてですが、リアルタイム測位をサポートする世界空間地図を構築するのに十分なデータをどのように収集するつもりですか?まずはその質問の前提についてお話しいただいた方がいいかもしれません。空間インテリジェンスの進歩にはデータが鍵となるのは言うまでもありません。データなしでは不可能ですから、その点についてお話しいただけると嬉しいです。

フェイフェイ・リー:まだ詳細を公表していません。準備が整っていないからです。準備が整い次第、改めてお話しします。この方が私たちが開発しているものをどうやって知ったのか、少し興味があります。これはあくまでも彼らの解釈なので、コメントは控えさせていただきます。ただ、おっしゃる通り、人工知能はデータ駆動型であり、これは非常に重要です。当社の空間インテリジェンスは完全にピクセルベースなので、膨大なピクセルデータがこの技術開発の原動力となるでしょう。

李菲菲:いい質問ですね。男の子でも女の子でも、田舎に住んでいてもシリコンバレーに住んでいても、12歳の子はみんな、このことを受け入れるように促されるべきです。好きなら、受け入れてください。エイミーの言ったことに関して言えば、私も12歳の時に同じことを考えていました。当時は人工知能なんてありませんでした。少なくとも、私はその存在を知りませんでした。私は数学と物理が大好きでした。今では、両親と先生方が私のためにしてくれたことに感謝しています。エイミーと私の生徒全員に言いたいのは、自分の情熱と好奇心に従い、粘り強く生きてくださいということです。もし否定的な意見があっても、無視してください。両親、先生、友達、ロールモデルなど、周りには多くの人がいて、みんながあなたを応援しています。努力を続け、前進し続けてください。

トム:朝食を作ること以外に、空間知能が解決できる最も重要な人間の問題は何ですか?

フェイフェイ・リー:空間知能は、創造からデザインまで、実に様々な分野を牽引することができます。ロボットから拡張現実(AR)、仮想現実(VR)、そして教育、学習、ヘルスケア、工場製造といった特定の分野に至るまで、あらゆる家具の配置換えを想像できるアプリケーションを、皆さんはどれほど望んでいるでしょうか。これは、あらゆる分野に影響を与える、非常に普遍的な水平展開技術です。

トム:小型モデルとARグラスを組み合わせることについて質問があります。検討したことはありますか?

フェイフェイ・リー:新しいメディアには本当にワクワクしています。私たちはシリコンバレーにいますし、皆さんもVision Proを買うために徹夜したと思いますので、私も本当にワクワクしています。Appleが空間コンピューティングと呼んでいるのは、私が長年空間インテリジェンスについて考えてきたからです。空間コンピューティングには空間インテリジェンスが必要だから、そう思うのです。メガネの形もとても魅力的です。小型コンピューティング、エッジコンピューティングも非常に興味深いです。しかし、小型モデルはメガネやヘッドマウントデバイスだけに使えるわけではありません。実際、スマートデバイス、ロボット、特に家庭用ロボットなど、エッジコンピューティングにおいても非常に強力です。車のトランクにサーバーを搭載できるようになったのです。つまり、小型モデルには多くの用途があるということです。

トム:人材育成におけるマルチモーダルモデルとスマートグラスの役割に非常に興味を持っています。電気技師が不足している現状では、イヤホン型AIとスマートグラスが、見習い制度の一環として、タイムリーかつ適切なトレーニングを提供できることは容易に想像できます。この分野における他言語の不足に対処するために、私たち、研究コミュニティ、そして企業は何ができるでしょうか?

フェイフェイ・リー:良い質問ですね。データの偏りなどにも関係します。まず、AIへの公共投資についてですが、すべての国がAIに投資すべきです。これは地域の文化や言語にも関係します。この観点から、個々の研究者がこれらの問題に焦点を当てることは重要ですが、政府や大規模なリソースを投入できる組織の存在も不可欠です。英語は確かに優勢であり、私たちはこれを認識する必要があります。これは先ほどの公共投資に関する指摘に戻りますが、この国にも、他の言語で考える優れた研究者や学生はたくさんいると思いますが、現状ではデータセットや計算リソースが不足しています。この問題に取り組む必要があります。

トム:聴衆からは哲学的な質問がいくつかありました。「スタンフォード大学で人文科学や社会科学の分野の人々と関わるためにどのような努力をされたのか、また、コンピューター科学者として興味深いと感じられた、彼らから得られた洞察の例にはどのようなものがあるのか​​を知りたいです。」

フェイフェイ・リー:実は、この5年間で最も興味深かったのは、この研究所の設立と共同運営です。この研究所の設立と共同運営には、キャンパス全体との関わりが深く関わってきました。特にスタンフォード大学には、ロースクール、ビジネススクール、メディカルスクール、そして現在の持続可能開発学部、人文科学、自然科学、工学部など、約8つの学部があり、同僚と話したり、キャンパスの学生、研究者、学者と交流したりすることは、非常に興味深く、刺激的でした。何を学んだか?人文科学の同僚との会話は、人間の表現と創造性に対する理解を真に広げてくれました。これは、AIと非常に創造的な人々の関係性をどのように考えるか、特にハリウッドの脚本家ストライキ後にChatGPTとSoraが登場したことで、アーティストの声、個人の著作権、そしてアーティストがこのツールをどのように活用しているかといった問題に深く関わるようになったことを意味します。

これは実に複雑な問題です。私はこれらすべてを理解するための正式な教育を受けていません。両親は私に、このことについて考え、この聴衆、おそらく非常に専門的な技術者や技術専門家とコミュニケーションをとることを教えてくれました。人文科学や社会科学の専門家の意見に耳を傾け、彼らと関わることが非常に重要です。そして、法務、製品、マーケティング、その他の部門を問わず、自分の職場環境においても、テクノロジーは真空中で存在するわけではないからです。テクノロジーを社会に役立てるには、複雑な人間の努力が必要です。謙虚さと敬意を持って他者を受け入れ、彼らにふさわしい尊厳を与えることこそが、こうした架け橋を築くために私たちができる最も基本的なことです。

トム:説明可能で理解可能な AI の分野で進歩を遂げることはどれほど重要だとお考えですか?

李菲菲:全体的には重要ですが、この問題についてはより微妙なニュアンスを考慮する必要があります。例えば、説明可能性には様々なレベルがあります。タイレノールが発熱や頭痛に効くことは誰もが知っていますが、タイレノールの分子経路について説明してください。実際、今日でも科学者たちは詳細をすべて把握しているわけではありませんが、タイレノールは説明不可能な薬だと言う人はいないでしょう。なぜなら、医薬品の開発、規制措置、そして医薬品の承認プロセスに関する十分な説明があり、あなたや大多数の国民が信頼できると感じるからです。

解釈可能性のもう一つの形態は、例えばGoogleマップです。特にラファイエットから車で移動する場合、Googleマップが役立ちます。Googleマップに目的地を入力すると、ルートの選択肢が表示され、4分近くかかるルートを選ぶかもしれません。正直なところ、A地点からB地点への移動アルゴリズムは説明されていませんが、人間のユーザーとしては、その選択には十分な解釈可能性があると感じます。医療の話に戻ると、治療内容を理解している人はほとんどいませんが、医師は人間の言葉で説明してくれます。私はこの例を使って、ユースケースを考えることの重要性を共有しています。そして、解釈可能性の定義を考えることも重要であり、この定義を具体的なユースケースと一致させることが重要です。

メカノ分子経路レベルでの解釈可能性は必ずしも必要ない場合もあれば、異なる種類の解釈可能性が必要となる場合もあります。したがって、ご質問にお答えすると、これは重要ですが、ユースケースに応じて、その重要性は状況によって異なります。

トム: AIに加えて神経科学も研究されたとおっしゃっていましたね。「AIは神経科学から何を学べるか」という問いに関心を持つ人もいます。畳み込みニューラルネットワークは人間の視覚系にある程度ヒントを得ており、ドーパミン報酬回路の研究も行われており、これは強化学習の着想にもなっています。神経科学とAIの連携の可能性は他にどのような分野にあるとお考えですか?

フェイフェイ・リー:全くその通りです。この部屋の電球は20ワットです。スタンフォードAIを設立した際、3つの主要な研究柱の一つは神経科学でした。学際的なコラボレーションは、私たちの分野の進歩と両分野の未来にとって不可欠です。私はSGガリー氏、マイク・フランク氏、ノア・グッドマン氏のような同僚と仕事ができることを幸運に思います。スタンフォードには、この学際的な研究の最前線に立つ同僚がたくさんいます。例えば、幼児期の発達、特に初期の子供たちは、好奇心に駆られた学習を多く行います。これをAIシステムにどのように変換できるでしょうか?これは私たちのインスピレーションの源です。また、背景にあるのは、脳内の2つのニューロン間で起こっていることを非常に単純化した解釈に過ぎないこともわかっています。シナプス結合に加えて、樹状突起結合も数多く存在し、これらは実際には非常に電気的、化学的、そして複雑なものです。今日、これらの複雑で興味深いシナプスとニューロンのコミュニケーションチャネルを考慮した機械学習アルゴリズムは存在しません。

オリジナル動画: CHM Live | Fei-Fei Li's AI Journey、 https://www.youtube.com/watch..._wow8

Li Feifei の原文は Z Potentials から翻訳されており、学術的な共有のみに使用されます。

いいね (3件のいいね!)↓