|
設立から10年未満で、評価額が10億ドルを超える革新的な企業は、ユニコーンと呼ばれます。ユニコーンは、無限の市場ポテンシャルを秘めた高業績の株式であり、業界に技術革新とビジネスモデルの革新をもたらすリーダーです。 大規模モデルの時代では、同様の新しい価値の境界線も形成されつつあります。 1日あたり10億トークンの消費は、AIビジネスを成功させるための基本基準です。 QuantumBit による 2024 年後半の市場データのレビューによると、エンタープライズ サービス、コンパニオンシップ、教育、インターネット、ゲーム、端末などの分野を網羅する少なくとも 200 社の中国企業がこの基準に達しています。 これは、ビッグモデル時代の「トレンドを掴む」戦いが終わり、真に価値のあるビジネスモデルが生まれ始めていることを意味します。 さまざまな垂直分野の先駆者たちがシナリオを見つけ、毎日少なくとも 10 億トークンの消費を達成できたという事実は、最も直接的な証拠です。 しかし、疑問なのは、なぜ 1 日あたり 10 億トークンが基準になっているのかということです。 毎日のアクティブユーザー数とユーザーあたりのトークン消費量を表示しますまず、1 日あたり 10 億トークンの消費が何を意味するか計算してみましょう。 DeepSeek API ドキュメントに記載されている標準を参照してください。 英語 1 文字 ≈ 0.3 トークン。 漢字 1 文字 ≒ 0.6 トークン。 中国語圏では、 10億トークンはおよそ16億文字以上に相当します。会話量に換算すると、『紅楼夢』1巻には約70万~80万文字が含まれており、1日で『紅楼夢』2,000巻分の内容をAIと議論するのに相当する計算になります。 生成 AI モデルは応答ごとに平均 1,000 トークンを処理する必要があるという推定に基づくと、10 億トークンは 1 日あたり 100 万件の応答が完了することを意味します。 To C アプリケーションの場合、100 万の応答は最大で 100 万 DAU に相当します。 Zuoyebangを例に挙げると、同社の海外製品Question.AIのデータだけに基づくと、1日のトークン消費量は10億近くに達する。 このAI教育アプリは、大規模なモデルをベースとし、画像ベースの質問検索やインテリジェントティーチングアシスタントなどの機能をサポートしています。チャットボット形式で説明や質問への回答が可能です。 課題の質問と実際の質疑応答シナリオに基づくと、対話1ラウンドあたり500トークンが消費され、平均的な人は1日に少なくとも3ラウンドの対話を行うと推定されます。公開されたデータによると、Question.AIの1日あたりのアクティブユーザー数(DAU)は約60万人です。 これを踏まえると、Question.AIだけでも1日あたり約10億トークンを消費していると推定されます。一方、Zuoyebangも複数のAIアプリケーションを展開し、複数のAI学習マシンをリリースしているため、1日あたりのトークン消費量はさらに多くなると考えられます。 AI支援チャットフィールドでDream Islandを見てみましょう。 最新情報によると、『ドリームアイランド』には50万人以上のクリエイターが登録しており、上位20位のクリエイターのうち85%をオリジナルクリエイターが占めている。『ドリームアイランド』のユーザー1人あたりは平均して1日4,000文字以上を入力でき、1日の平均会話回数は120回を超える。 1 人のユーザーが 1 日に得る AI 出力の平均は、入力の 2 ~ 3 倍で計算すると、約 8,000 ~ 12,000 語になります (AI 出力には、AI 仮想人間対話応答、AI 生成プロンプトと回答などが含まれます)。 QuantumBit Think Tankのデータによると、Dream Islandの1日あたりのアクティブユーザー数(DAU)は現在約10万人です。これに基づくと、Dream Islandの1日あたりのトークン消費量は10億を超えると推定されます。 エンドユーザーのシナリオでは、トークンを消費する方法がより多様になります。 AIスマートフォンには、インテリジェントアシスタントに加え、ワンクリックでの不審者除去、通話要約、ワンクリックでの画面認識など、様々なAI機能がシステムに統合されています。OPPOの2024年10月のデータによると、Xiaobu Assistantの月間アクティブユーザー数は1億5000万人を超えました。 さらに、クラウドベンダーが公開しているトークン使用量や顧客情報も、このベンチマークの参考になります。 2024年7月、テンセント・フンユアンは、1日の通話量が数千億トークン(自社事業を含む)に達したことを明らかにした。 2024年8月、百度は「文心ビッグデータモデル」の1日平均呼び出し回数が6億回を超え、1日あたり1兆トークン以上のテキスト処理量を記録しました。11月初旬には、「文心ビッグデータモデル」の1日平均呼び出し回数は15億回を超えました。1年前の5000万回から、1年で30倍に増加したことになります。 2024年7月、Doubaoの大規模モデルにおける企業顧客1人あたりの1日あたりの平均トークン使用量は22倍に増加しました。12月には、ByteDanceがDoubaoの一般モデルにおける1日あたりの平均トークン使用量が4兆円を超えたことを明らかにしました。 この消費は誰から来るのでしょうか? Volcano Engineの公式サイトで公開されている顧客リストによると、自動車、金融、インターネット、消費者小売、スマート端末、ゲーム、ヘルスケア分野の大手メーカーはいずれも著名な有名ブランドです。 一方、これらの「10億トークンクラブ会員」が2024年にどうなったかは、この価値の限界に対する強力な参考資料にもなります。 AI事業が成長の重要な貢献者となった。まずは、海外で注目を浴びているZuoyebangについて見てみましょう。 2023年9月、Zuoyebangは長年蓄積された教育データとAIアルゴリズムを統合したGalaxy Big Modelを発表しました。これは教育分野向けに特別に設計されており、複数の教科、複数の学年、複数のシナリオをカバーしています。 Sensor Towerの2024年上半期データによると、同社の海外製品「Question.AI」は米国におけるAIアプリのダウンロード数でトップ3に入り、月間アクティブユーザー数100万人を達成しました。また、会話型AI製品「Poly.AI」もダウンロード数でトップ30にランクインしました。 一方、より直接的な収益を生み出すことができるAI 学習マシンもあります。 2024年7月、フロスト&サリバンの調査により、Zuoyebangが中国における上半期のオンライン学習機器売上高で第1位を獲得したことが認定されました。Luotu Technologyのデータによると、2024年第3四半期には、Zuoyebangの学習機器製品がオンライン市場売上高で第1位となり、市場シェアは20.6%でした。 エンタープライズサービス分野では、 Kingsoft Cloudは2024年第1四半期の財務報告で、主にAI関連の顧客による総収益が前四半期比3.1%と着実に増加したと述べています。 パブリッククラウドの売上高は11億8,700万人民元に達し、前四半期比12.9%増加しました。これは主にAIクライアントの牽引によるものです。この成長により、CDNサービスの積極的な縮小にもかかわらず、パブリッククラウド全体の売上高は2023年の同四半期比で2.9%増加しました。 この傾向は第 2 四半期、第 3 四半期にも続き、 AI 顧客は依然としてパブリック クラウド ビジネスと全体的な収益の主な成長に貢献しています。 みなさんの日常生活に一番近いAIスマートフォンについて見てみましょう。 大規模モデルのトレンドの到来を受けて、OPPOは明確な姿勢でこの波に乗り、ColorOSと全製品ラインに生成AI機能を導入しました。2024年までに、約5,000万人のOPPOユーザーがスマートフォンにGenAI機能を搭載できるようになる予定です。 Counterpointのデータによると、2024年の世界トップ4のスマートフォンメーカー(市場シェア順)は、Samsung、Apple、Xiaomi、OPPOでした。 Canalysのデータによると、AI搭載スマートフォンは2024年に世界のスマートフォン出荷台数の16%を占めました。予測では、この割合は2028年までに54%に急増すると示されています。AIスマートフォン市場は、2023年から2028年の間に63%の複合年間成長率(CAGR)で成長すると予測されています。この変化は、ハイエンドモデルで最初に現れるでしょう。 例えば、OPPOが新たに発売したFind X8シリーズは、AIへの注力度がさらに高まっています。Doubao Universal Model Pro、Doubao Universal Model Lite、Doubao Role-Playing Model、そして大型モデル向けのより強力なリアルタイムオンライン検索機能を導入することで、OPPO Find X8シリーズはより洗練されたAIサービス体験を提供します。 この傾向は、クラウド コンピューティング分野では、トークン消費量のさらなる増加という形で反映されています。 インタビューの中で、Volcano Engineの創設者であるTan Dai氏は次のように述べています。 今後5年間で、企業が毎日使用するトークンは、特にエージェントがさまざまなシナリオに従うマルチモーダル ビッグデータ モデルの開始後には、大量の消費が発生するため、数百兆に達する可能性があります。 このようなデータ予測の背後には、コンピューティング インフラストラクチャ、エージェント開発、AI アプリケーション開発、大規模モデルの全体的な実装における変化についての微妙な洞察が隠されています。 エージェント + AI インフラストラクチャ: 数兆トークンの消費は夢ではないアプリケーション実装の観点から見ると、エージェントのトレンドはますます顕著になり、AIネイティブアプリケーションが勢いを増し始めています。 OpenAI CEO の Altman 氏は年末の総括で次のように述べています。 2025 年までに、最初の AI エージェントが「労働力に加わり」、企業の生産性を大幅に変える可能性があると私たちは考えています。 これに続いて、OpenAI は行動を起こし、エージェント機能を立ち上げ、ChatGPT に他のユーザーに代わってさまざまなタスクを実行する能力を与えました。 より実践的なレベルでは、QuantumBit Think Tank はネイティブ AI アプリケーションが勢いを増し始めていることを観察しています。 基盤となるモデル機能が継続的にアップグレードされたことにより、AI スマート アシスタント アプリは過去 1 年間で大幅な成長を遂げました。 2024年には、AIスマートアシスタントアプリの新規ユーザー数が3億5000万人を突破しました。12月だけでも新規ユーザー数は5000万人を超え、2024年初頭と比較して約200倍の増加となりました。 例えば、Doubao(豆宝)は、9月に中国で初めてユーザー数1億人を突破したAIアプリとなり、現在では市場シェア50%以上を誇る「国家レベルのAIネイティブアプリ」 「No.1 AIスマートアシスタントアプリ」としての地位を確固たるものにしています。 本日、 Doubao Large Model 1.5 Proの最新バージョンがリリースされました。パフォーマンスが全面的に向上し、MoEアーキテクチャの最適化により、わずか7分の1のパラメータで高密度モデルの性能を上回ります。 マルチモーダル機能に関しては、ビジョン機能は動的解像度をサポートし、最大100万ピクセルの解像度の画像を処理でき、複数のベンチマークテストで優れた性能を発揮しています。音声に関しては、革新的なSpeech2Speechエンドツーエンドフレームワークを提案し、音声とテキストのモダリティを高度に融合することで、音声対話の理解度と表現力を向上させます。 一方で、モデルの推論能力は強化学習(RL)手法によって大幅に向上しました。進歩の面では、Doubao-1.5-Pro-AS1-Previewは、o1-previewやAIME上のo1などの推論モデルを上回りました。 より堅牢な基盤モデルは、間違いなく AI ネイティブ アプリケーションにさらに強固な基盤を提供します。 エンタープライズ分野に焦点を当てると、目に見える成長は早くから見られました。エージェント開発プラットフォームは、クラウドベンダーが提供するエンタープライズサービス製品の中で最も急速に成長している製品の一つとなっています。 たとえば、Volcano Engine が立ち上げた HiAgent は、わずか 7 か月ですでに 100 社を超える顧客を獲得しています。 これは、企業専用の AI アプリケーション イノベーション プラットフォームとして位置付けられており、企業がモデルからアプリケーションまでの「最後の 10 キロメートル」をゼロ コードまたはロー コードの方法で完了できるようにすることを目指しています。 HiAgentは複数のモデルと下位互換性があり、Doubaoの大規模モデルをネイティブに統合するだけでなく、サードパーティのクローズドソースまたはオープンソースのモデルとも互換性があります。プロンプトワードエンジニアリング、ナレッジベース、プラグイン、ワークフローオーケストレーションという4つの要素を通じて、インテリジェントエージェントを容易に構築できます。豊富なテンプレートとプラグインがプリロードされており、ある程度のカスタマイズの自由度を提供します。 現在、HiAgent は、200 を超えるアプリケーション シナリオと 500 を超えるエージェント モデルを使用して、China Feihe、Meiyijia、Huatai Securities などの Fortune 500 企業にサービスを提供しています。 Kouzi AI ネイティブ アプリケーション開発サービス プラットフォームは、SUPOR、China Merchants Bank、Hefu Noodles、Zhonghe Rural Credit Cooperatives などの企業がエンタープライズ レベルのエージェントを開発および起動するのにも役立っています。 HiAgentと比較して、AIアプリケーション開発者の不足と高いサービス安定性を求める企業をターゲットとしており、大規模モデルアプリケーション開発の参入障壁を下げています。AIアプリケーション開発プラットフォームであるKouziは、プラグイン、ワークフロー、画像ストリーム、ナレッジベース、データベースなど、一連のツールを提供しています。また、Doubaoの大規模モデルファミリー、エンタープライズ向け微調整モデル、オープンソースモデルとシームレスに統合し、企業ユーザーに豊富なアプリケーションテンプレートと、デバッグ、展開、統合、監視のためのライフサイクル全体にわたるサービスを提供します。例えば、ニュースプラグインを使用すれば、最新の時事ニュースを放送するAIアナウンサーを迅速に作成・起動できます。 これらの実践的な開発を通して、AIアプリケーション/エージェント開発の障壁が大幅に低下し、様々な業界が大規模な探索・開発の段階に入っていることが容易に分かります。先進企業はより迅速に行動し、大規模モデルを活用してビジネス変革を早期に実現し、そのメリットをいち早く実現しています。 業界における先駆的な事例の出現に伴い、AI活用の規模は今後さらに拡大していくでしょう。同時に、HiAgentのようなプラットフォームも進化を続け、インテリジェントエージェント開発の枠を超え、AI機能プラットフォームへと機能を拡張していくでしょう。 供給側から見ると、2024年のクラウドコンピューティング分野における最も顕著な現象は「価格競争」でした。その背景には、コンピューティングパワーのコストが依然として最適化の途上にあること、そしてクラウドベンダーが「価格と量」をトレードオフし続けることができるという事実があり、これがAIアプリケーションの実装トレンドを牽引しています。 業界では、将来のコンピューティングパラダイムは GPU を中心に据えるべきだと広く認識されています。 2024年、クラウドベンダーは、大規模推論の需要の高まりに対応するために、AIインフラ機能を強化し続けました。 例えば、Volcano EngineはAIクラウドネイティブソリューションを発表しました。大規模GPUクラスターの柔軟なスケジューリングと管理をサポートし、そのコンピューティング製品とネットワーク最適化はすべてAI推論向けに特別に設計されています。過去1年ほどの大規模モデルアプリケーションの展開において、Volcano EngineはMeitu、Moonton Technology、DeepTechなどの企業に強固なコンピューティング基盤を提供してきました。 先日開催されたVolcano Engine Force Winter Conferenceにおいて、同社はGPU中心のAIインフラ分散ビジネスシステムをさらにアップグレードし、vRDMAネットワークを介した大規模並列コンピューティングとP/D分離推論アーキテクチャをサポートすることで、トレーニングと推論の効率を向上させ、企業の利用コストを削減しました。EICエラスティック高速キャッシュソリューションはGPUへの直接接続を可能にし、大規模モデル推論のレイテンシを50分の1に、コストを20%削減しました。 技術的障壁とモデル価格の継続的な削減、そしてコンピューティング能力コストの継続的な最適化により、毎日数兆個のトークンが消費されることは単なる話ではなく、ほぼ手の届くところにある現実です。 したがって、単一の企業による 1 日あたりの 10 億トークンの消費は、非常に価値のあるベンチマークになります。 まず、これは大規模モデルの適用における新たなトレンドを示しています。企業は大規模モデルのメリットを活用し、この目標に向かって進むべきです。 第二に、これは大規模モデル適用の新たな段階への入り口となるものです。AIビジネスは本当に成立するのでしょうか?需要は本当に存在するのでしょうか?これらの疑問への答えは、これを参考にすることができます。 第三に、 1日あたり10億トークンの消費量は、大規模モデルの実装における「エントリーレベル」に過ぎません。顧客1人あたり数兆、あるいは数百兆トークンの消費量であれば、より有望な見通しとなります。 しかし、この新たな価値ベンチマークが形成されることで、誰がビッグモデルを実現する「ユニコーン」になれるのかを見極めやすくなるだろう。 |
AI時代においては、ユニコーンではなく、1日あたり平均消費量の10億トークンに注目してください。
関連するおすすめ記事
-
聞くクマのTeeni.AIはDeepSeekの大規模モデルと完全に統合され、トップ科学者のZhang Chiがチームに加わって技術的障壁を強化しました。
-
マルチモーダル長文ドキュメントの新たなベンチマークが登場!理解、推論、ローカリゼーションなど20以上のタスクを網羅し、GPT-4oは辛うじて合格しました。
-
もうDeepSeekの公式サイトにわざわざアクセスする必要はありません!この素晴らしいツールを使えば、参入障壁ゼロであなただけのパーソナルアシスタントを手に入れることができます。
-
CaLM 因果推論評価システム: 大規模モデルを人間の認知レベルに近づけるにはどうすればよいでしょうか?
-
60 社以上の産学研究エコシステム パートナー、共同主催者リスト、参加方法をご紹介します。
-
GoogleとMIT Kaiming Heのチーム:視覚的な大規模モデルはLLMと同じくらい効率的に拡張可能