618ZXW

セコイア・キャピタルの業界概要:生成型AIの開発

オリジナル Datawhale Datawhale

Datawhaleのヒント

最新情報:世界的に有名なベンチャーキャピタル会社、セコイア・キャピタル

生成 AI の開発:「速い思考」から「遅い思考」へ、自律アプリケーションの新たな章を開きます。

生成AI革命の2年間で、研究の焦点は「速い思考」(事前学習の迅速な応答)から「遅い思考」(推論中の深い思考)へと移行しつつあります。この変化は、市場インフラが安定し、Microsoft/OpenAIやAWS/Anthropicといった巨大企業が競争環境を形成したためです。

大規模モデルの市場構造が安定するにつれて、次の重要な領域が出現しています。焦点は推論層の開発と拡張に移り、「システム 2」の思考が支配的になり始めています。

推論レイヤーは、AIシステムが推論中に、単なる高速なパターンマッチングではなく、深い思考、問題解決、そして認知操作を行う能力を強化することを目的としています。これにより、AIシステムは人間と同様に深く考え、問題を解決できるようになります。

OpenAIのO1モデル:推論能力の飛躍的進歩

2024年の最も重要なモデルアップデートは、間違いなくOpenAIのo1(旧称Q*、別名Strawberry)でした。o1はOpenAIの主導的地位を確固たるものにしただけでなく、「推論時の計算」によって実現された、真に汎用的な推論能力を備えた最初のモデルでもありました。

通常、事前学習済みモデルは大量のデータから次の単語を予測し、「学習中の計算」に依存します。従来の事前学習済みモデルが「学習中の計算」に依存しているのとは異なり、O1モデルは、応答前に「考える時間」を設け、プロアクティブに推論を行います。

では、考えるのを止めたとき、o1 は何をやっているのでしょうか?

2016 年の AlphaGo とイ・セドルの対局はディープラーニングにおける重要な出来事でした。それは、AI が単にパターンを模倣しているのではなく、思考していることを世界が認識した瞬間でした。

事前学習済みの高速応答アルゴリズムに依存するモデルとは異なり、AlphaGoは囲碁データベースから学習し、自己対戦を通じて進化します。推論中にシナリオをシミュレーション・評価し、最適な解を選択します。推論時間が長くなるにつれて、AlphaGoのパフォーマンスは向上し、最終的には人間の最高の棋士さえも凌駕します。

AlphaGoのパフォーマンスを大規模言語モデルで再現する課題は、価値関数の構築、つまりモデルの応答をどのように評価するかにあります。O1モデルの根底にある重要なアイデアは、モデルが生成する思考連鎖を通じた強化学習であり、これは人間の思考や推論に似ています。

「強化学習は非常に重要です。AIの推論能力にまったく新しい層をもたらすものです。」

Datawhale 強化学習オープンソースチュートリアル: https://github.com/datawhalec...

AIの考え方の転換:システム1からシステム2へ、そして新たな拡張ルール

AI は、単純な事前トレーニング済みの応答 (「システム 1」) から、より深く、より慎重な推論 (「システム 2」) へと移行しています。

システム1はパターンの模倣に依存しています。それは、囲碁で何百万手もの手数えを経て習得したAlphaGoのスキルであれ、膨大な量のインターネットテキストで訓練された大規模言語モデルの言語能力であれ同じです。しかし、模倣は強力ではあるものの、真の推論ではありません。

複雑な新しい問題に直面したとき、システム2の深い推論能力が極めて重要になります。AIは複数の可能性を探索し、結果を評価し、論理的推論に基づいて意思決定を行い、複雑な問題に対処する必要があります。

O1 論文から得られる最も重要な洞察は、新しい拡張ルールの出現です。

事前学習済みの大規模言語モデルは、計算量とデータ量が多いほど性能が向上するという法則に従います。しかし、O1論文は新たな考え方を提示しています。推論時間(または「テスト時間」)に投入される計算量が多いほど、推論能力は向上するという考え方です。

この変化により、事前トレーニング済みのクラスターから推論クラウド環境への移行が促進され、AI 開発に新たな機会がもたらされます。

OpenAI、Anthropic、Google、Metaが推論レイヤーを拡張し、より強力な推論マシンを開発し続ける中で、何が起こるのでしょうか?すべてを支配する「スーパーモデル」が登場するのでしょうか?

アプリケーション層企業は、基本モデルに基づくシンプルなインターフェースから、複雑なコグニティブアーキテクチャの構築へと進化してきました。これには、複数の基本モデル、ルーティングメカニズム、RAG(リアルタイム分析)用のデータベース、そしてコンプライアンスに準拠し人間の思考プロセスを模倣するロジックが含まれます。

投資方向分析:あらゆるレベルにおける機会と課題

世界的に有名なベンチャーキャピタル企業であるセコイア・キャピタルは、どのような点に重点を置いているのでしょうか?また、その資金はどこに投資されているのでしょうか?

  • インフラストラクチャ: インフラストラクチャは、大企業にとっては得意分野ですが、ベンチャー キャピタリストにとっては得意分野ではありません。
  • モデル:モデルレベルは、超大規模企業と金融投資家との競争領域です。
  • 開発者ツールとインフラストラクチャ ソフトウェア: 戦略的投資家にとっては魅力が低いが、ベンチャー キャピタリストにとっては魅力が高い。
  • アプリケーション:アプリケーション層はベンチャーキャピタリストにとって最大の関心事です。クラウドとモバイルへの移行期には、年間売上高が10億ドルを超えるアプリケーション層企業が出現し、AI分野でも同様の傾向が見込まれています。

将来の展望

生成AIの次の段階では、推論技術の開発がアプリケーション層に大きな影響を与えるでしょう。現在の多くの認知アーキテクチャは「アンロック」技術を採用しており、将来的にはこれらの機能がモデルにさらに深く統合され、エージェントアプリケーションはより強力になるでしょう。

研究室では、推論と推測時間の計算は依然として重要なトピックであり、新しい拡張ルールによって次の競争ラウンドが始まりました。

しかし、現実世界のデータを収集し、特定のドメインで認知アーキテクチャをコーディングすることは依然として困難であり、一方で、ラストマイル アプリケーション プロバイダーは複雑な現実世界の問題を解決する上で有利になる可能性があります。

将来的には、工場のロボットなどのマルチエージェントシステムがますます一般的になり、推論や社会的学習プロセスをモデル化する手段として機能するようになる可能性があります。

誰もが生成型AIの「37歩目」、つまりイ・セドルとの2度目の対局におけるAlphaGoのように、汎用人工知能システムが人間の能力を超えるような独自の思考能力を発揮する瞬間を待ち望んでいる。

これは、知覚、推論、行動のプロセスをシミュレートし、AI が斬新かつ有用な方法で探索できるようにしたことを意味します。これが AGI の本質なのかもしれません。

その時が来れば、その動きは偶然ではなく、単に技術の次の段階になります。

参考リンク:https://www.sequoiacap.com/ar...

いいね (3件のいいね!)↓