618ZXW

ザッカーバーグ氏がジェンセン・フアン氏と対談: AI モデルはオープンソースではないので、悪態をつくつもりです。

「いや、そんなのやめろ。」

ザッカーバーグ氏は、終了したばかりのSIGGRAPH 2024でNvidiaのジェンスン・フアン氏と会話している最中に、思わず悪態をついてしまった。

なぜでしょうか?簡単に言うと、ザッカーバーグ氏はクローズドソースや非オープンソースについて言及されるたびに激怒するのです。

ほんの数日前、ザッカーバーグ率いるMetaチームは大規模モデルLlama 3.1をリリースし、「最強のオープンソースモデル=最強のモデル」というマイルストーンを初めて達成しました。さらに、オープンソースであるため、ユーザーはソースコードにアクセスし、変更し、配布することができます。

黄氏との会話の中で、ザッカーバーグ氏はオープンソースモデルに継続的に取り組むことは一種の「利己的な」好みであると認めた。

しかし、さらに先を見据えると、誰もが独自のソーシャルメディアプロフィールを持つのと同じように、すべての企業が独自の AI を持つようになる日が来ると彼は考えています。

黄院士は感謝の意を表し、ラマ2を「昨年のAI分野における最大のイベントだったかもしれない」と称賛した。これに対しザッカーバーグ氏は「いや、H100だと思う」と友好的な賛辞で反論した。

友好的な(あるいは気まずい)会話の最中に、ザックはラオ・ホアンに新しい服、黒いシープスキンのジャケットをプレゼントした。

老黄がいつも着ている革のジャケットは、彼の妻が買ってくれたものだということを知っておいてください。

レザージャケットは以前と同じ黄色ですが、レザージャケット自体はもう同じではありません。

しかし、ザッカーバーグ氏のブログ記事で気づいたかもしれないが、彼らの熱心な意見交換はオープンソースに限定されたものではなかった。

最近、世界的に話題になっているAIエージェントスマートグラスもあります。

さらに、両者とも次世代のコンピューティングに期待を抱いています。

MetaはAI Studioを正式にリリースし、ユーザーがカスタマイズ可能な性格を持つ仮想キャラクターやチャットボットを作成できるようになりました。

Nvidia はさらに一歩進んで、特定の目的で AI を使用するために必要な多くのロジスティックスの問題を解決できる AI モデル用のソフトウェア パッケージであるNIM (Nvidia inference micro) の正式リリースを発表しました。

二人は記憶に残る名言を頻繁に口にしました。

  • Llama 4 以降のモデル エクスペリエンスは、双方向の会話を行う単純なチャットボットのようなものではなくなります。
  • たとえ基本モデルの進歩が今止まったとしても、私たちがこれまでに構築してきたものはすべて、5 年間の製品イノベーションには十分です。
  • 成功するのにこんなに時間がかかると知っていたら、私もあなたのように学校を中退して、もっと早くから始めていたでしょう。
  • 率直に言うと、私たちがオープンソースを採用した理由の一つは、他のテクノロジー企業よりも遅れていたため、これらの施設を構築した頃には、競争上の優位性が失われていたことです。
  • 私たちは現在、本質的にソフトウェア 3.0 に突入しています。

この記事では、ザッカーバーグ氏と黄氏の会話を原文の意味を変えずに翻訳しました。

この記事は、NVIDIAの一連の新開発成果を紹介して締めくくられています。NVIDIAにのみご興味がある方は、最後までスクロールして必要な情報をご覧ください。

会話のトランスクリプト

Huang : 私たち全員、MetaのPyTorchを使っています。Metaはコンピュータービジョンと言語モデルの分野で多くの成果を上げてきました。まず最初にお聞きしたいのは、Metaの現在の生成AIにおける進歩についてどうお考えですか?また、業務の強化や新機能の導入にどのように応用できるでしょうか?

ザッカーバーグ氏:生成 AI を取り巻くすべてが楽しい革命であり、最終的には当社のすべての製品を楽しい方法で変えることになると思います。

すでに提供している製品ラインの一部をご覧ください。Feed、Instagram、Facebookなどは、単なる友人同士のつながりを作るツールから、今日の姿へと進化してきました。

このプロセス全体を通して、コンテンツの順序は常に非常に重要です。例えば、友達が何かとても重要なことを伝えたい場合、その情報はフィードの一番上に表示させたいはずです。

ここ数年で状況は変化し、様々なパブリックチャンネルからより多くのコンテンツが発信されるようになりました。友人からの数百、数千の投稿ではなく、数百万ものコンテンツが集まるようになったため、レコメンデーションシステムは極めて重要になっています。これは非常に興味深いレコメンデーション問題となっています。

生成AIの発展により、私たちはすぐに新たな段階に入ると信じています。

この段階では、Instagram で表示されるコンテンツのほとんどは、ユーザーの興味に基づいて推奨されるだけでなく、投稿者をフォローしているかどうかとは関係ありません。

将来、これらのツールを使って様々なものが作られるようになると思います。クリエイターがこれらのツールを使って制作するコンテンツもあれば、リアルタイムで生成されたり、世界中の様々な情報を統合して合成されたりもするでしょう。

これは、当社のビジネスがどのように進化していくかを示すほんの一例であり、この進化は 20 年間にわたって続いています。

しかし、世界最大のコンピューティング システムの 1 つが推奨システムであることに気付いている人はほとんどいないと思います

これは全く異なる道筋であり、よく話題になる生成AIのホットな話題とは違います。しかし、他のTransformerアーキテクチャと同様に、非構造化データを特徴量に埋め込み、より汎用的なものを徐々に構築していくことに似ていると思います。

つまり、以前はコンテンツの種類ごとに異なるモデルを使用していた可能性があります。以前は、短い動画を推奨するためのモデルと長い動画を推奨するためのモデルという、2つの別々のモデルを使用していました。製品を調整することで、これらの機能を統合し、同じプラットフォーム上で重複コンテンツが表示されないようにしました。

より幅広いコンテンツをカバーする、より一般的な推奨モデルの開発を継続するにつれて、推奨パフォーマンスはますます向上しています。

これは部分的にはコンテンツの経済的利益と流動性によるものだと私は考えています。より幅広いコンテンツプールからコンテンツを引き出すことで、断片化されたソースからコンテンツを引き出す際に生じる効率の低下を回避できるのです。

これらのモデルがより大きく、より一般的になるにつれて、そのパフォーマンスは向上し続けます。

Facebook や Instagram のようなプラットフォームが統合 AI モデルを通じて管理される日が来ることを夢見ています。

このモデルは、さまざまな種類のコンテンツとシステムを統合し、今日見たい興味深いコンテンツを紹介するだけでなく、知り合いの可能性のある人やフォローしたいアカウントを推奨するなど、長期的なソーシャル ネットワークの構築と拡張にも役立ちます。

:だからこそ、あなたのコミュニティではAIのディープラーニングへの応用に常に関心が寄せられているんですね。すでにGPUインフラを構築し、長年にわたり大規模なレコメンデーションシステムを運用されていますね。

現時点で生成 AI が本当に素晴らしいのは、最近 WhatsApp を使用するとき、WhatsApp を操作しているように感じることです。その感覚がとても気に入っています。

そこに座ってタイピングすると、入力内容に基づいて画像が生成されます。戻って文言を修正すると、別の画像が生成され、なかなか良い出来栄えです。さらに、写真も読み込めるようになりました。

ザッカーバーグ氏:生成AIは長期的には私たちが使用するすべてのワークフローと製品に大きなアップグレードをもたらし、多くの全く新しい創造物を生み出すだろうと信じています。

Meta AIは、様々なタスクを支援するAIアシスタントのアイデアを持っています。これは非常に革新的で多用途なものになるでしょう。時間の経過とともに、あらゆる質問に答えられるようになるでしょう。

Llama 3 シリーズから Llama 4 以降のモデルにアップグレードすると、プロンプトを出すと応答し、さらに別のプロンプトを出すと再び応答するといった単純なチャットボットのようなエクスペリエンスではなくなると思います。

代わりに、人間が意図を与えることで、複数の時間枠にわたって動作できるようになるのです。例えば、これらの機能のいくつかは、数週間から数ヶ月かかる計算ジョブを開始し、まるで世界で何かが起こったかのように、結果を返してくれます。これは非常に強力なものになると思いますので、とてもワクワクしています。

ラオ・ファン:おっしゃる通り、現在のAIは単純な質問と回答をするだけです。しかし、人間は課題に直面すると、複数の選択肢を検討し、さらには意思決定ツリーを構築して頭の中で様々な判断をシミュレートし、計画を立てているのです。

将来、人工知能も同様のことを行うようになるでしょう。おっしゃったクリエイターAIには非常に期待しています。率直に言って、素晴らしいアイデアだと思います。

Creator AIとAI Studioについてご紹介します。

ザッカーバーグ:実は、これは私たちが推進している取り組みです。AIモデルが1つだけでは十分ではないと考えています。他の企業もまさにそうしており、中央エージェントを構築しているようです。

Meta AIアシスタントは引き続きご利用いただけますが、製品をご利用いただくすべての方が独自のエージェントを作成できるよう支援したいと考えています。プラットフォーム上のクリエイターの方でも、中小企業の方でも、最終的にはすべてのコンテンツを迅速に統合し、顧客とのエンゲージメントや売上向上などを支援するビジネスエージェントを構築したいと考えています。

私たちが現在リリースしているツールの 1 つは AI Studio と呼ばれ、これは、最終的には各クリエイターがコミュニティ内でのやり取りのために、自分と同様の AI エージェントまたはアシスタントを構築できるようにするツール スイートです。

クリエイターにとって問題の一つは、コミュニティとの交流を深めたいと思っても、時間が限られていることです。同様に、コミュニティもあなたと交流したいと思っていても、なかなか難しいものです。そこで、最善の解決策は、人々にこれらのエージェントを作成し、自分のスタイルに合わせて、望む方法で自己表現できるようにトレーニングすることです。

将来、人々は様々な目的で独自のAIエージェントを作成するようになると考えています。特定の実用的なタスクを実行するためにカスタマイズされたエージェントもあれば、エンターテイメント性を重視し、興味深いコンテンツや少しユーモラスなコンテンツを作成するエージェントもあるでしょう。Meta AIアシスタントに直接統合することはないかもしれませんが、人々はこれに非常に興味を持っていると思います。

私たちが目にした興味深いユースケースの一つは、これらのエージェントを社会的な交流を支援するために利用しているというものです。Meta AIは複雑な社会シナリオをロールプレイするための主要なツールの一つとなっているため、これは私にとって少し驚きです。

キャリアアップ、給与交渉、友人やパートナーとの争いなど、これらのエージェントは、人々が会話をシミュレートし、対話の方向性を検討し、フィードバックを受け取ることができる公平な環境を提供します。

さらに、多くの人は、Meta AI Assistant や ChatGPT などの従来の AI エージェントと対話したいだけでなく、自分専用のパーソナライズされたエージェントを作成したいと考えています。これはまさに私たちの AI Studio の目標です。

私たちは、単一の大規模な AI と対話することだけが選択肢ではないと考えています。多様なエージェントがいる世界は、はるかに刺激的で興味深いものになるでしょう。

Old Huang :独自のスタイルとポートフォリオを持つアーティストにとって、これは本当に素晴らしい機能だと思います。これら全てをAIモデルに統合することで、あなたの芸術的スタイルに基づいた創作をガイドしたり、絵画のインスピレーションとなる作品を提供したり、それに基づいて新しい作品を制作したりできるようになります。

私のロボットにアクセスするのと同じように、私のAIにもアクセスできます。将来的には、あらゆるレストランやウェブサイトにこのようなAIが導入されるかもしれません。

ザッカーバーグ:はい、将来的にはあらゆる企業が顧客とやり取りするAIを持つようになると思います。商用版ではより多くの統合が可能になりますが、まだアルファ版のごく初期の段階です。

Lao Huang : AI Studio を使用してギャラリーを微調整できますか?

ザッカーバーグ:はい、そうします。

黄老:そうすれば、書き込んだものをすべてアップロードして、自分専用のデータベースとして使えるようになります。使うたびにメモリがリロードされ、前回滞在した場所が記憶されます。

そうすれば、会話が中断されなかったかのように会話を続けることができます。

ザッカーバーグ:どんな製品でもそうですが、時間とともに改善されていきます。理想的なバージョンは、テキストだけではありません。これらのことは決して遠い未来の話ではないと思います。フライホイールは急速に回転しており、まだ構築すべき新しいものがたくさんあります。

たとえ基本モデルの進歩が今止まったとしても、製品イノベーションにはまだ 5 年あると思います。業界全体が、これまでに構築されたものすべてを最も効果的に活用する方法を見つけるには十分な時間です。

しかし、実際には、基礎モデルや基礎研究の進歩は加速しており、かなりクレイジーな時期だと思います。

ご存知のとおり、このすべてはあなたのせいで起こったのです。

老黄:ありがとうございます。私たちCEOは繊細な花なので、たくさんのサポートが必要です。

ザッカーバーグ:私たちはこれまで多くのことを経験してきました。私たちは業界で最も経験豊富な創業者二人のうちの一人だと思います。

黄老:その通りだ。

ザッカーバーグ:あなたの髪は白くなり、私の髪は長くなりました。

黄爺:私の髪は白髪になって、あなたの髪は縮れ毛になったけど、どうしたの?

成功するまでにこんなに時間がかかると知っていたら...

ザッカーバーグ:絶対に始めないんですか?

黄爺:いや、君みたいに学校を中退して早くから始めるよ。君には12年の差がある。本当にすごいね。

:誰もがAIを、そしてあらゆる企業がAIを活用できるというあなたのビジョンに共感します。当社では、すべてのエンジニアとソフトウェア開発者がAIを活用できるようにしたいと考えています。Llamaをリリースした当時、オープンソースだったというのは素晴らしいと思います。だからこそ、Llama 2は昨年最大のAIイベントだったと言えるでしょう

ザッカーバーグH100だと思います。

:ありがとうございます。私がこれを最大の出来事と呼ぶ理由は、当時あらゆる企業や業界を活性化させたからです。突如として、誰もが人工知能の開発に取り組むようになりました。研究者全員がAIという出発点を得たことで、AIと再び繋がる機会を得たのです。

そして今、Llama 3.1がリリースされ、私たちは協力してその展開に取り組んでいます。ところで、あなたのオープンソース哲学はどこから来ているのですか?

ザッカーバーグ:正直に言うと、その理由の一つは、当社が他のテクノロジー企業よりも遅れて分散コンピューティング インフラストラクチャとデータ センターの構築を開始したことです。

したがって、これらの施設を建設する頃には、もはや競争上の優位性は失われているでしょう。ですから、オープンソース化して、周囲のエコシステムの恩恵を受けるのが賢明でしょう。

当社には同様のプロジェクトが多数ありますが、その中で最大のものはおそらくOpen Compute プロジェクトです。このプロジェクトでは、サーバー設計、ネットワーク設計、さらにはデータ センター設計まで公開しています。

これらの設計を一種の業界標準にすることで、サプライチェーン全体が実質的にそれらを中心に組織化され、誰もがコストを節約できるというメリットがもたらされます。オープンソース化することで、実質的に数十億ドルのコストを削減できました。

Open Compute プロジェクトにより、1 つのデータ センター向けに設計された Nvidia HGX をすべてのデータ センターで実行できるようになりました。

素晴らしい経験でした。その後、ReactやPyTorchといった多くのインフラツールでも同様の取り組みを行いました。Llamaが登場する頃には、AIモデルのオープンな利用に対して既に非常に前向きな姿勢でした。

次世代のコンピューティングでは、オープンエコシステムが勝利し、再びリーダーとなることを少し期待しています。クローズドエコシステムとオープンエコシステムは常に存在し、それぞれに存在理由があります。

私たちがリリースするものがすべてオープンソースというわけではありません。クローズドソースのプロジェクトにも取り組んでいます。しかし、全体として、オープンソースソフトウェアは、業界が構築しているコンピューティングプラットフォームに大きな価値をもたらすと信じています。

ARとVRの分野では、AndroidやWindowsのような、複合現実(MR)向けのオープンなオペレーティングシステムを構築しています。これにより、様々なハードウェア企業と連携し、様々なデバイスを開発できるようになります。私たちは、エコシステムをこのオープンなレベルにまで回復させたいと考えています。

私はこれについて非常に楽観的です。次世代ではオープンシステムが普及するでしょう。

私はただ、アクセス権があることを確認したいだけなのです。これは少し利己的なことかもしれませんが、私がこの会社を立ち上げてから 10 ~ 15 年間やってきたことの 1 つは、私たちが構築しようとしているソーシャル エクスペリエンスの基盤となるテクノロジーを確実に構築できるようにすることです。

これまで作ろうとしてきたものが山ほどあるのですが、プラットフォームプロバイダーから「いや、それは作れない」と言われると、「いや、そんなのやめろ」と言いたくなります。次の世代のために、私たちは最後までやり遂げなければなりません。

申し訳ないのですが、クローズドプラットフォームについて話をしろと言われると怒ってしまうので…

△ズッカーの罵倒は老黄によって手動でミュートされた:「ビィィィィ――」

Lao Huang : これは素晴らしい世界だと思います。最高の AI を構築し、それをサービスとして世界に提供することに尽力している人々がいる世界です。

同時に、もし自分でAIを作りたいなら、それは十分に可能です。AIをプログラミングし、使いこなす能力は非常に重要です。個人的には、自分で革ジャンを作るよりも、誰かに作ってもらう方が好きです。

革がオープンソースになるという考えは私にとってあまり有益ではありませんが、素晴らしいサービスとオープンサービスを持つという考えはとても良いと思います。

バージョン3.1で405B、70B、8Bといった様々なサイズのモデルが提供されるようになったのは素晴らしいですね。より大きなサイズのモデルを使ってこれらのモデルを学習させ、合成データの生成に活用できます。

大規模なモデルはより汎用的ですが、特定の業務に適した、あるいはより費用対効果の高い小規模なモデルを構築することも可能です。また、モデルの構築方法は透明性が高く、世界クラスのセキュリティおよび倫理チームを擁していることに、大変感謝しています。

ザッカーバーグ:先ほどの続きですが、私たちはこれを存在させたいから構築しており、特定の閉じたモデルから独立したものにしたいと考えています。

しかし、これは単なるソフトウェアではなく、それを取り巻くエコシステムです。オープンソースがなければ、おそらくうまく機能しないでしょう。私たちは利他主義から行動しているわけではありませんが、これはエコシステムにとって役立つと考えています。

私たちがこれを実行するのは、強力なエコシステムを構築することで、私たちが構築している製品がより良くなると信じているからです。

Huang : PyTorch エコシステムに貢献した人はどれくらいいるでしょうか? Nvidia だけでも、PyTorch をより良く、よりスケーラブルに、そしてより高性能にすることに尽力している人材が数百人いるでしょう。

ザッカーバーグ:何かが業界標準になると、他の人々もそれに基づいて作業するようになります。これは誰にとっても有益であり、私たちが構築しているシステムともうまく連携します。これはほんの一例ですが、オープンソース戦略は非常に優れたビジネス戦略であると私は考えています。しかし、その戦略はまだ人々に十分に理解されていません。

Lao Huang : 私たちはこれをとても気に入っており、その周りにエコシステムを構築しました。

ザッカーバーグ:皆さんは本当に素晴らしいです。新しい製品をリリースするたびに、それをうまく機能させるための最適化をいち早くリリースしてくださっています。本当に感謝しています。

黄老:何と言っていいでしょう?当社には優秀なエンジニアがいます。

シニアマネージャーとして、年齢は上ですが、CEOに求められる機転の利く資質は健在です。そこで、ある重要な点に気づきました。それは、ラマモデルの重要性です。ラマモデルを軸に、誰もがAIを構築できるよう支援する「AIファクトリー」を構築しました。

多くの企業は、AIが企業にとって不可欠であるため、自社でAIを導入したいと考えています。これは、AIがデータループに統合されると、企業の知識がAIにエンコードされるためです。このループを外部委託することは不可能であり、オープンソースがその機会を提供します。しかし、問題は、プロセス全体をAIに翻訳する方法がわからない場合が多いことです。

だからこそ私たちは「AIファクトリー」を立ち上げました。ツール、専門知識、そしてLlamaテクノロジーを提供することで、AIサービスへのプロセス全体の変革を支援します。AIサービスが完成すれば、お客様は成果物を完全に所有できます。私たちはこの成果物をNIMと呼んでいます。お客様はNIMをダウンロードし、ローカルサーバーを含むあらゆる場所で実行できます。

また、NIMを運用できるOEMや、LlamaベースのNIMとプロセス構築のためのトレーニングを受けているアクセンチュアなどのコンサルティング企業を含むパートナーエコシステムも構築しています。現在、私たちは世界中の企業がこれを実現できるよう支援しています。これらはすべて、Llamaのオープンソース性から生まれたものであり、非常にエキサイティングなことです。

ザッカーバーグ:特に、大規模なモデルから独自のモデルを抽出できるように支援することは、非常に価値のある新しいトレンドになるでしょう。製品について議論した際にも申し上げましたが、誰もが利用するような支配的なAIエージェントは存在しないと思いますし、同様に、すべてのニーズを満たす単一のモデルも存在しないでしょう。

Huang :チップ設計、ソフトウェアコーディングなど、様々な分野に特化したAIを備えています。ソフトウェアコーディングAIはUSDTとVerilogを理解し、エラーデータベースを分析して問題を分類し、適切なエンジニアに割り当てます。各AIはLlamaに基づいて細かく調整されており、それぞれに特定の適用範囲と制限を設けています。

将来的には、あらゆる企業のあらゆる機能に専用の AI が導入されるようになると思います。

ザッカーバーグ:そうですね。将来的には、より複雑で大規模なモデルを使うようになるのか、それとも特定の目的のために独自のモデルを訓練するのか、という大きな疑問があります。おそらく、様々な特化型モデルが登場するでしょう。

:エンジニアの時間は非常に貴重です。現在、パフォーマンスを最適化した405Bモデルを使用しています。このモデルは単一のGPUに収まらないほど大きいため、MVLinkのパフォーマンスが非常に重要です。すべてのGPUをMVLinkスイッチで接続することで、405Bモデルを効率的に実行できるようにしています。

私たちにとって、数セントの節約よりも、最高の結果を達成することの方が重要です。エンジニアの皆様に最高品質のツールを提供したいと考えています。

ザッカーバーグ:確かに、405Bの推論コストはGPT-4モデルの約半分で、これは非常に優れています。デバイス上で実行する必要がある場合や、より小さなモデルが必要な場合は、それを蒸留することができます。これは全く新しいサービス分野です。

:チップ設計に使用しているAIのコストが1時間あたりわずか10ドルで、複数のエンジニアで共有できるとしたらどうでしょうか。エンジニアに支払っている高額な給与を考えると、1時間あたり数ドルで生産性を大幅に向上させることは、非常に価値のある投資です。

ザッカーバーグ:そうですね、その点については私を説得する必要はありません。

Old Huang :まだ AI を使い始めていないなら、今すぐ始めましょう。

次世代のテクノロジーについてお話ししましょう。特に、私たちがよく使う「すべてをセグメント化する」モデルなど、コンピュータービジョン分野における取り組みには感謝しています。現在、世界をより深く理解するためのビデオAIモデルの学習、ロボット工学と産業デジタル化のモデリング、そしてこれらのモデルをOmniverseに統合する作業を進めています。

これにより、物理世界をより適切にシミュレートし、仮想環境でのロボットのパフォーマンスを向上させることができます。

AIを現実世界に導入するというビジョンを掲げた、Meta Ray-Banスマートグラスプロジェクトは非常に興味深いですね。この点について詳しく説明していただけますか?

ザッカーバーグ:おっしゃった「Splitter Everything」モデルについては、実は今年のSIGGRAPHカンファレンスで次期バージョン「Splitter Everything 2」を展示しています。より高速になり、動画にも対応しています

これは多くの興味深い効果をもたらすでしょう。オープンソースであるため、様々な業界でより本格的な応用が生まれるでしょう。科学者たちは、サンゴ礁、自然生息地、そして景観の進化を研究するためにこれを使用しています。また、ゼロショット学習であるため、インタラクションが可能で、追跡したいものを指示できるため、非常に興味深い研究です。

黄老:例えば、倉庫内にたくさんのカメラが設置されているとします。倉庫AIは、あらゆる出来事を監視しています。例えば、たくさんの箱が倒れたり、誰かが地面に水をこぼしたり、何か事故が起こりそうになったりすると、AIはそれを認識し、テキストメッセージを生成して、助けを求める人に送信します。これがAIの活用方法の一つです。

すべてを記録するわけではなく、何を見ているのかを理解しているので、重要なものだけを記録します。

レイバンのスマートグラス以外には今何をしていますか?

ザッカーバーグ:次世代コンピューティング・プラットフォームを考えるとき、私たちはそれを複合現実ヘッドセットとスマートグラスに分類します。現在、世界には10億人以上の人々がメガネをかけており、それらのメガネは最終的にスマートグラスにアップグレードされ、非常に大きな市場となるでしょう。そのため、人々はスマートグラスをより容易に理解し、受け入れるようになると思います。

VR/MRヘッドセットはゲームやその他の用途に適していると考える人もいれば、そうでないと考える人もいます。私の見解では、どちらのタイプのデバイスも存在するでしょう。

スマートグラスは、携帯電話のように常時接続の次世代コンピューティングプラットフォームになると考えています。一方、複合現実ヘッドセットは、ワークステーションやゲーム機のように、より没入感のある体験をしたい時や、より多くのコンピューティングパワーが必要な時に利用されるでしょう。結局のところ、スマートグラスは小さく、多くの制限があります。携帯電話で同じレベルのコンピューティングを実行できないのと同じです。

Lao Huang : ちょうど、生成 AI におけるこうしたブレークスルーがすべて同時に起こったのです。

ザッカーバーグ:はい、スマートグラスに関しては、2つの異なる角度からアプローチしています。1つは、理想的なホログラフィックARグラスに必要な技術だと考えるものを開発することです。グラスが機能するために必要なことはすべて行っています。

メガネのように見えますが、今使っているメガネとはまだ程遠いです。レイバンでさえ、ホログラフィックARに必要な技術をすべて搭載することはできません。数年後には、ホログラフィックARに近づくと思います。まだ高価ですが、製品化されると信じています。

△メタレイバンスマートグラス

この問題を別の角度から見ると、世界有数のアイウェアメーカーであるエシロール・ルックスオティカと提携し、見た目に美しいメガネを提供することから始めることが重要になります。彼らは数々のビッグブランドを生み出してきました。

アイウェア業界のNvidiaです

ザッカーバーグ:彼らもその例えを気に入ってくれると思います。誰もがそう思うでしょう。レイバンと共同でこのプロジェクトを進めており、現在は第2世代に入っています。目標は、形状を非常に美しい範囲に維持しつつ、その上で可能な限り多くのテクノロジーを組み込むことです。

カメラセンサーを搭載しているので、写真や動画を撮影したり、Instagramでライブ配信したり、WhatsAppでビデオ通話をして、相手と映像を共有したりできます。マイクとスピーカーも搭載しており、スピーカーはオープンバックタイプなので、イヤホンよりも快適だと感じる方も多いでしょう。音楽を聴いたり、電話に出たりすることも可能です。

しかし、後にこのセンサーがまさに AI と通信するために必要なものであることが判明しました。これはやや予想外のことでした。

5年前に、ホログラフィック AR と AI のどちらが先に実現されるのかと聞かれたら、私はおそらくホログラフィック AR と答えていたでしょう。

つまり、これはディスプレイ技術の進歩であり、仮想現実と複合現実のあらゆる側面にわたって新しいディスプレイ スタックを構築することであり、私たちは常にその方向に進んでいるということです。

その後、LLMは画期的な進歩を遂げました。今では非常に高品質なAIが実現し、ホログラフィックARが登場する前から、その進化は急速に進んでいます。これは私が予想していなかった逆転現象です。

幸いなことに、私たちは様々な製品を開発してきたため、良い立場にあります。しかし、最終的には、様々な価格帯で、様々なレベルのテクノロジーを搭載した様々なメガネ製品が登場するようになると思います。Ray-Ban Metaの現状から判断すると、 300ドル台のディスプレイレスAIメガネは非常に大きな製品となり、最終的には数千万、数億人の人々に愛用されるようになるでしょう。

:つまり、超インタラクティブなAIと会話できるようになるということですね。先ほど実演していただいた視覚言語理解能力にはリアルタイム翻訳機能も搭載されています。ある言語で話しかけると、私は別の言語であなたの話を聞くことができます。

ザッカーバーグ:ディスプレイは素晴らしいですが、メガネの重量が増え、価格も高くなります。ですから、ホログラフィックディスプレイを求める人は多いと思います。しかし、最終的には本当に薄くて軽いメガネを求める人もたくさんいるでしょう。

物理的に私がそこにいなくても、信じられないほどリアルなホログラフィック画像が存在し、一緒に作業できる仮想会議ができる未来はそう遠くありません。

いずれ、より薄いメガネやより厚いメガネなど、様々なスタイルのメガネが登場するでしょう。今お使いのメガネにホログラフィック機能を搭載するには少し時間がかかると思いますが、少し厚めのメガネでホログラフィック機能を実現するのはそう遠くない未来です。

メガネが市場に出る前にインパクトを与えられるよう、ファッションインフルエンサーになりたいです。

ラオ・ファン:ファッション業界において、あなたはどれほどの影響力を持っていますか?成果はどれほどありますか?

ザッカーバーグ:まだ初期段階です(doge)。

将来、人々が身につけるファッショナブルなアイウェアの製造が事業の大きな部分を占めるようになったら、もっと慎重にならないといけないかもしれません。毎日同じ服を着ている自分とはお別れしないといけないですね。

これも眼鏡の話ですが、時計や携帯電話とは違うと思います。誰もが皆同じような見た目になりたくないので、先ほどお話ししたように、眼鏡はプラットフォームとしてオープンなエコシステムになると思います。なぜなら、形やスタイルに対する人々のニーズは非常に多様になるからです。誰もが他人がデザインした眼鏡をかけたいわけではありませんし、そのようなアプローチは成功しないと思います。

Old Huang :おっしゃる通りだと思います。私たちは今、コンピューティングスタック全体が再発明されつつある時代を生きています。これは素晴らしいことです。私たちは今、いわばソフトウェア3.0の時代にいると言えるでしょう。

汎用コンピューティングからこの生成ニューラル ネットワーク処理アプローチまで、現在開発できる機能とアプリケーションは、過去には想像もできなかったものです。

生成型AIは、気候から生物学、物理学まで、多岐にわたる分野にまたがり、消費者、企業、産業、そして科学にこれほど急速に影響を与えた技術を他に思い浮かべることができません。この根本的な変化の中心にあります。そして、あなたがこれまで話してきたことすべてがあります。

先ほど「Jensen AI」ってあるの?と聞かれました。まさにクリエイティブAIですね。自分たちでAIを作れるんです。これまで書いたものをすべて取り入れて、質問に答える方法を使って微調整していきます。使い続けることで蓄積された経験が、素晴らしいアシスタント、そしてパートナーになっていくことを願っています。

今では多くのことが可能になります。あなたと仕事ができて本当に良かったです。会社を立ち上げるのは簡単ではないことは分かっています。あなたはデスクトップからモバイル、そしてVR、AIへと事業を拡大してきました。NVIDIA自身も多くの変革を経験しているので、それがどれほど難しいことかはよく分かっています。私たち二人とも長年にわたり、何度も教訓を学んできましたが、それはパイオニアでありイノベーターであるために必要なことなのです。

ザッカーバーグ:あなたも同じだと思いますよ。

誰もが「いや、すべてがこれらのデバイスに移行するだろう。必要なのは超安価なコンピューティングだけだ」と言う一方で、あなたは「いや、実際には並列処理できる大規模なシステムが必要になるだろう」と言い張っていた時期がありました。そこで私たちは別の道を歩み始めました。

: そうです。現在、デバイスをどんどん小型化しているのではなく、コンピューターを可能な限り大型化しています。

ザッカーバーグ:しばらくは流行っていませんでした。

黄老:昔はとてもダサかったけど、今はかっこいいですね。

(老黄のもの)もう一つ

ジェンセン・フアン氏とマーク・ザッカーバーグ氏が会談した同じ日に、Nvidia は一連の新たな動きを見せた。

比如,正式发布NIMs(Nvidia inference micro services),一个软件包,能解决特定目的下使用AI时会遇到的很多后勤问题。

这玩意儿3月的时候老黄就浅浅介绍过了,它通过打包算法、系统和运行时优化并添加行业标准API 来简化AI模型部署流程,“推动企业大规模部署AI模型”。

比如,宣布和抱抱脸合作,推出“推理即服务”。

开发者可以通过托管,把抱抱脸上的开源AI模型快速制作并部署到生产中。

再比如,推出fVDB,利用现实世界的3D数据,打造空间智能。

再再比如,推出Isaac Lab,一个用于机器人学习的开源模块化框架。

它可以解决传统训练方法对机器人学习技能的限制,用来开发、训练和构建下一代人形机器人。

一边对谈传递观点,一边kuku发新产品。

不愧是老黄,啥也没落下。

参考链接: [1]https://www.nvidia.com/en-us/... [2]https://www.threads.net/@zuck...