618ZXW

大規模モデルこそが新たなデータベース!アント・ファイナンシャルのオープンソース部門責任者、王旭氏:アプリケーション開発の新たなパラダイム、次世代LAMPが形作られつつある | MEET 2025

奥飛寺QbitAI編集チームによる編集 | WeChat公式アカウントQbitAI

大規模モデルをオープンソースにするかクローズドソースにするかという議論は、技術開発の道筋、産業エコシステムの構築、将来のイノベーションの推進力への影響といった点に焦点が当てられているため、依然として注目されている話題です。

アントグループのオープンソース技術委員会の副委員長である王旭立氏は次のように主張した。

データ生成機能を備えたモデルが、従来のアプリケーションの中核にあるデータベースに取って代わりつつあります。

Wang Xu は現在、Ant Financial のオープンソース テクノロジの成長とコンテナ インフラストラクチャを担当しています。

MEET カンファレンスでは、データを証拠としてオープンソースをテーマにプレゼンテーションを行い、さまざまな観点から大規模モデルの技術アーキテクチャ、インフラストラクチャ、革新的なアプリケーションがどこに向かうべきかを明らかにしました。

さらに、AI時代には新世代のLAMPが登場しており、モデルはデータベースよりも移植性が高く、データ伝送リンクとデータセキュリティの需要が高まると述べました。

MEET 2025 Intelligent Future Conferenceは、QuantumBitが主催する業界サミットで、20名を超える業界代表者が議論に参加しました。1,000名を超える来場者と320万人を超えるオンライン視聴者が集まり、主要メディアからも大きな注目を集め、大きく報道されました。

中核的な視点の要約

  • 過去1年半、特に昨年は、AI技術が様々なアプリケーションに浸透してきました。モデルと直接やり取りして画像やテキストを生成するという分野を超えた「新しいビジネス」はまだ多くは生まれていませんが、その量と速度の急激な増加は、既に非常に大きな変化を引き起こしています。
  • Llama2 オープンソース モデルのリリース後、AI エージェント フレームワーク プロジェクトの数は爆発的に増加しましたが、現在ではいずれも主流になっていません。
  • 私たちのプログラマーコミュニティは、AIを恐れる段階からAIを理解し、そしてAIを受け入れる段階へと移行しました。そして、日々の生産性向上アプリケーションは徐々にインテリジェント化され、 「データ入力ツール」から「魂を持った協働パートナー」へと変化しています。GenAI時代において、インフラは変化しましたが、完全に変わったわけではありません。
  • データ生成機能を備えたモデルは、従来のアプリケーションの中核としてデータベースに取って代わりつつあります。AI時代においては、新世代のLAMPが登場し、これらのモデルはデータベースよりも移植性が高く、データ伝送リンクとデータセキュリティに対する需要が高まっています。

(本来の意味を変えずに、QuantumBitは以下のように要約しています)

データ入力ツールから「魂を持った協力パートナー」へ

モデレーターの皆様、そしてご参加いただいた皆様、ありがとうございました。まずは簡単に自己紹介をさせてください。私は王旭と申します。Ant Groupでオープンソース関連の業務を担当し、コンテナインフラチームを率いています。5年半前はコンテナ分野のオープンソーススタートアップに携わっていましたが、現在はAnt Groupでインフラ分野のアーキテクトも務めています。

これらの経験を共有するのは、これまでの講演者とは異なり、私のバックグラウンドは人工知能ではなくインフラとシステムであり、研究者ではなくエンジニアであることを示すためです。博士号は取得していますが、研究分野は回路です。この経歴が、皆さんに新たな視点を与えてくれることを願っています。

Ant Group のオープンソース テクノロジ成長チームはアーキテクチャ部門に属しており、その目標の 1 つは、オープンソース コミュニティからの洞察を活用して Ant のアーキテクチャとテクノロジの進化を導くことです。

大企業は通常、社内で継続的な技術進化を遂げると同時に、外部の新たな技術の方向性も模索しています。このプロセスにおいて、私たちはコミュニティからより中立的で多角的なデータを収集し、テクノロジープラットフォーム、アーキテクチャ、そして技術進化全体に関する包括的な理解を構築します。

今回はコミュニティデータをいくつかご紹介します。このデータは網羅的ではないかもしれませんし、完全に公平で客観的なデータではないかもしれませんが、特定の企業の立場にとらわれない外部の視点を反映していると言えるでしょう。このデータを簡単にご紹介することで、皆様に興味深い洞察を提供できれば幸いです。

過去 1 年半、特に昨年、AI テクノロジーはさまざまなアプリケーションに浸透してきました。

モデルと直接対話してテキストや画像を生成すること以外には、新しいビジネスチャンスはそれほど多くありませんが、量と速度の大幅な向上は、大きな変化を引き起こすのに十分です。

金融関連のテクノロジー企業であるアント・グループを例に挙げましょう。同社の事業には財務諸表分析が含まれており、従来は多くの経験豊富な人材が必要とされていました。大規模モデルを用いることで、財務諸表を効率的かつ包括的に、そしてタイムリーに分析することが可能になります。これほど高度で洞察力に富んだ大規模モデルを開発した企業は未だに存在しませんが、その膨大なデータ量と効率性は、もはやかつて達成不可能なレベルに達しています。

このようなアプリケーションを構築するには、何らかのインフラストラクチャが必要です。Ant Group は最近、この作業をサポートするマルチエージェント フレームワークである agentUniverse をオープンソース化しました。

もちろん、そのようなインテリジェント エージェント フレームワークは 1 つだけではありません。

私たちは過去 2 年間のオープンソース コミュニティ全体からいくつかのデータを取得し、それをクラスター化して、AI アプリケーションの構築と AI アプリケーションの迅速な開発のためのフレームワーク、インテリジェント エージェント フレームワーク、およびその他のツールをいくつか抽出しました。

ChatGPT、特にオープンソースの大規模モデルLlama2のリリース以降、様々なオープンソースAIアプリケーションフレームワークやインテリジェントエージェントフレームワークが次々と登場し、急速に成長しています。これらのフレームワークは、応用シナリオの急速な増加と相まって、様々な専門分野で広く利用されています。

上のグラフの曲線は、過去 2 年間のプロジェクトの人気またはアクティビティ レベルを示しています。

このデータはGitHubのスター数だけに基づいているわけではありません。このプログラマーのソーシャルネットワークにおける交流方法は他にも多く、評価要素として活用できます。例えば、プロジェクトへの参加者数、参加者の所属企業や組織の分布、異なる組織からの参加者間の交流などです。

現在、オープンソースコミュニティには多くのAIエージェントフレームワークプロジェクトが存在します。Llama2オープンソースモデルのリリース以降、その数は爆発的に増加しており、まだ一つのプロジェクトが主流を占めているわけではありません。

上のグラフからわかるように、様々なプロジェクトには明確な傾向が見られます。好調にスタートしたものの減少に転じたプロジェクトもあれば、引き続き上昇を続けているプロジェクトもあります。プロジェクトの評価には多くの要因が影響するため、この傾向はプロジェクトの運営状況を完全に反映しているわけではありませんが、コミュニティ開発の参考として活用できます。

上記のプロジェクトのほとんどは、大手企業の従来のJavaアプリケーションではなく、Pythonを用いて開発されました。多くのユーザーは、Pythonを使ってフォームに記入するだけで「 30分で独自のAIアプリケーションを開発」することができ、ローコード開発も可能です。ローコードによるインタラクティブな生成手法の普及は、はるかに進んでいます。AIフレームワークは、アプリケーションシナリオへの適応を加速させ、私たちに多くの変化をもたらしています。

先ほどお話ししたのが、AI 機能を中心に設計された、いわゆる「ネイティブ AI」アプリケーションだとすれば、従来のアプリケーション分野のアプリケーションや開発ツールも AI の影響を受けるようになっています。

プログラマー自身を例に挙げてみましょう。私たちプログラマーは実に興味深い集団です。一方では、AIに取って代わられるのではないかと日々不安に駆られ、他方では、自分たちに取って代わるAIを開発しています。AIが生産性向上の能力を持つようになると、彼らはすぐにAIを活用して自らのツールを変革し始めます。

いわゆる「 AIを恐れ、AIを理解し、AIを受け入れる」。

上の画像は、VSCode が非表示になってから過去 2 年間の IDE 開発ツールのコミュニティ アクティビティを示しています (VSCode が存在する場合は、画面の上部に表示されます)。

青い曲線はCursorを表しています。これは開発ツールプロジェクトであり、最近最も急成長しているプロジェクトの一つとなっています。AI関連のタグを使った共同開発は、この分野で非常に人気が高まっています。

これは、私たちが日常的に使用するさまざまな生産性アプリケーションが徐々にインテリジェント化され、「データ入力ツール」から「魂を持った協力パートナー」へと移行し、人間でさえ AI と協力できるようになっているという傾向を反映しています

データセキュリティに懸念のある企業にとって、大規模な外部モデルを無差別に使用することは絶対に推奨されません。例えば、Ant Groupでは、AIを活用したプログラミングを支援する独自のIDEフレームワーク「CodeFuse」も提供しています。

GenAI 時代になってインフラストラクチャは変化しましたが、完全に変化したわけではありません。

では、この文脈において、インフラは実際に変化したのでしょうか?

状況は変わりましたが、完全に変わったわけではありません。

GenAI時代において、マスク氏が開発した10万基のGPUクラスターのように、コンピューティング能力は急速に向上しています。この時期、インフラチームはAIのトレーニングと推論のためのリソースを準備しています。まず思い浮かぶのは、GPUと高性能ネットワークを中核とするインテリジェントコンピューティングハードウェアです。

ハードウェアの観点から見ると、確かに大きな変化が見られます。しかし、基盤となるソフトウェアインフラストラクチャに大きな変化はなく、唯一の違いは技術的な選択の違いにあります。

トレーニングも同じ分散システム フレームワーク内で行われ、さまざまな階層化された方法を利用して、パフォーマンス、安定性、コスト、セキュリティに関するさまざまなトレードオフが行われます。

「異なるトレードオフ」によってもたらされるインフラストラクチャの最大の変化は、ハードウェアの違いではなく、アプリケーションパラダイム自体の変化から生じます。

アプリケーションニーズへの対応という点では、AIインフラの構築プロセスにおいて多くの新しい要素が登場しました。アーキテクチャ自体は大きく変わっていないように見えるかもしれませんが、生成AIのニーズの変化は、より大きく、より深遠な影響を与えています。

従来のアプリケーションである「非ネイティブ AI アプリケーション」が AI に向けて進化し、モデルに基づいて構築され始めると、この進化はどのような変化をもたらすのでしょうか。

新しい世代の LAMP が形成されつつあります。

観察されたデータから、いくつかの簡単な結論を導き出すことができます。つまり、データ生成機能を備えたモデルが、従来のアプリケーションの中核でデータベースに取って代わりつつあるということです

Xu Liは先ほど、主張をすると間違いが証明されることが多いと述べましたが、建築家としては常に主張する勇気を持たなければなりません。まずは私の主張を述べ、間違いが証明されることについては後で話しましょう

AI時代には、新世代のLAMPが登場し、モデルはデータベースよりも移植性が高くなり、データ転送リンクとデータセキュリティに対する需要が高まっています。

LAMP(Web 2.0アプリケーション開発パラダイム)は2000年頃に登場し、従来のデータベースをアーキテクチャ全体の中核としています。大企業では、データベースは膨大な量のデータストレージを扱い、インフラストラクチャはデータベースを中心に構築されます。

AI時代において、私たちは変化を目の当たりにしてきました。インフラはモデルを中心に構築されるようになったのです。モデルの制作からサービス提供に至るまで、モデルの規模を小さく保ちつつ大規模な伝送を可能にすることは、インフラのあらゆる側面に大きな影響を与えています。

新しいパラダイムの影響下、インフラ構築者や関係者はどこに注力すべきでしょうか?何を開発すべきでしょうか?新しいフレームワークを書くべきか、既存のインフラを改良するべきか、データを整備するべきか、など。これらは、皆様にとって有益な情報となることを願っております。

インフラ業界やソフトウェア業界に携わる私たちにとって、この時代は大きな変化をもたらしました。これらの変化は、時代全体を通して進化し続けるアプリケーションのニーズに起因しており、ソフトウェアアーキテクチャの調整とインフラの進化を促すものです。

本日のプレゼンテーションはこれで終了です。オープンソースの観点から少しでも参考になれば幸いです。ありがとうございました!