618ZXW

杭州の「六小龍」に投資した後、杭州は今度は北京の「六小虎」への投資を開始した。

6匹の「小龍」を擁した杭州の次のターゲットは、北京の6匹の「小虎」である芝浦だ。

というのも、つい最近、Zhipu からの最新の資金調達ニュースは次のとおりです。

杭州市からの強力な支援を受けて、Zhipuは最近、杭州市投資産業基金やShangcheng Capitalなどの投資家とともに10億元を超える戦略的資金調達ラウンドを完了した。

この資金調達発表では、資金の用途も明らかにされており、Zhipuの国産GLM大規模ベースモデルの技術革新とエコシステム開発に使用される予定だ。

もちろん、Zhipu は今回の資金を活用して、浙江省や長江デルタ地域の急成長する経済主体にさらに貢献し、人工知能技術に基づくデジタル産業の変革とアップグレードを全面的に推進していきます。

Zhipuの売上高は休暇後1か月も経たないうちに1億元を超え、有料APIプラットフォームは30%以上の成長を記録したと報じられている。

次の質問は次のとおりです。

6つの「リトルタイガー」のうち4つは北京に拠点を置いているが、なぜ杭州はZhipuを選んだのだろうか?

なぜ志布?

一言でまとめると、Zhipu は包括的高速、そして強力です。

まず、大規模モデル開発の状況から見ると、Zhipuは中国でOpenAIと完全に競合できる唯一の大規模モデルプレイヤーと言えます。

Zhipu は、兆ベースモデル、対話モデル、コードモデル、マルチモーダルモデル、推論モデル、エージェントテクノロジーなどの分野を完全にカバーしています。

さらに、独自に開発されたGLM アーキテクチャはGPT シリーズと完全に連携しており、完全な超大規模インテリジェント モデル システムを形成します。

GLM アーキテクチャは、その基盤となるオペレーターからトレーニング フレームワークに至るまで完全に独自に開発されており、西洋の技術障壁を打ち破り、独立した制御可能なイノベーション システムを形成しています。

OpenAI の GPT シリーズは主に自己回帰モデルを使用します。これはテキスト生成において単方向であり、前の単語に基づいて次の単語を予測することしかできません。

ただし、この一方向性により、コンテキスト間の依存関係を完全に把握できないため、特定の自然言語理解 (NLU) タスクにおけるモデルのパフォーマンスが制限される可能性があります。

ZhipuのGLMは、自己回帰的空白補完を主な事前学習目標として採用しています。このアプローチにより、モデルはテキスト生成時に文脈情報を考慮することができ、言語構造の理解と生成能力が向上します。

GLM のオリジナルアルゴリズムが Nature 誌にも掲載されたことは特筆に値します。

第二に、近年の Zhipu の大規模モデルの反復速度は、中国の大規模モデル プレイヤーの中でも速いと言えます。

2024 年に発売された GLM-4-Plus ペデスタル モデル、AutoGLM エージェント モデル、GLM-Zero 推論モデルは、同様の OpenAI 製品に匹敵するパフォーマンスを備えており、マルチモーダルおよび長文推論のシナリオで際立っています。

これはZhipuの数多くの「リリース」のほんの一例に過ぎません。昨年だけでも、時系列順に並べると「登場」は以下のとおりです。

  • 12月には、論理的推論による数学的問題の解決に優れたゼロ推論モデル「GLM-Zero-Preview」がリリースされました。
  • 11月には、AutoGLMのアップグレード版がリリースされ、50ステップ以上のロングステップ操作を自律的に実行できるほか、複数のアプリにまたがるタスクも実行できるようになり、新しい「完全自動」のインターネット閲覧体験が実現し、数十のブラウザベースのウェブサイトで自動運転がサポートされるようになりました。
  • 11月には、GLM-PCが社内テスト用にリリースされました。CogAgentインテリジェントスペクトルマルチモーダルモデルをベースとし、「自律型」PCの概念を探求しています。ビデオ会議への参加、ドキュメント処理、Webページの検索と要約、リモートスケジュール操作の実行など、ユーザーに代わって操作を実行できます。
  • 11月には、ビデオモデルCogVideoXがアップグレードされ、10秒間の再生時間、4K、60fpsの超高精細画質、任意のサイズ、そして人間の動作や物理世界のより優れたシミュレーションをサポートしました。CogVideoX v1.5-5BとCogVideoX v1.5-5B-I2Vも同時にオープンソース化されました。
  • 10月には、GLM-4-Voiceエンドツーエンド感情音声モデルがリリースされ、Qingyanアプリで利用可能になりました。感情を理解し、感情を表現し、感情に共鳴し、音声速度を自動調整し、複数の言語と方言をサポートし、遅延が少なく、いつでも中断できます。
  • 10月には、API呼び出しに制限されることなく、テキスト/音声コマンドを受信するだけで携帯電話の人間による操作をシミュレートできるAutoGLMベータ版をリリースしました。
  • 同社は10月、サムスンおよびクアルコムと提携し、エッジデバイス向けのAI製品および大規模マルチモーダルインタラクションモデルを共同開発すると発表した。
  • 8月には、テキスト、音声、ビデオといったモダリティを網羅する大規模リアルタイム推論モデル「GLM-4-Videocall」がリリースされ、AIを活用した人間とのリアルタイムビデオ通話が可能になりました。APIを介して、スマートフォンを含む様々なカメラ付きエッジデバイスにシームレスに導入できます。
  • 8月には、言語理解、命令準拠、長文処理などの総合的な性能向上を実現した新世代ベースモデルGLM-4-Plusが発売されました。
  • 7月には、動画生成モデル「青影」が青影のPC、モバイルアプリ、ミニプログラムプラットフォームで正式にリリースされ、テキストと画像から動画を生成するサービスを提供しています。わずか30秒で6秒間の動画を生成し、現実世界の運動プロセスをリアルに再現します。
  • 6月には、100万トークンの長文と26言語に対応したGLM-4-9Bモデルがオープンソース化されました。また、GLMをベースとした視覚モデルGLM-4V-9Bも初めてオープンソース化され、GPT-4Vに匹敵するマルチモーダル機能を備えています。
  • 1月には、新世代の大型台座モデルGLM-4がリリースされました。前世代と比較して、全体的なパフォーマンスが大幅に向上し、より長いコンテキストをサポートし、マルチモーダル機能を強化し、推論速度を向上させ、より高い並行性をサポートし、推論コストを大幅に削減しました。

さらに、OpenAI の「クローズド」アプローチとは異なり、Zhipu は中国で最も早く大規模モデルをオープンソース化した企業の 1 つでもあります。

2021年の100億モデルGLM-10Bの発売から、2022年の最初の1000億モデルのオープンソースGLM-130Bの発売、そして2023年のChatGLMの発売まで、Zhipuはオープンソースを通じて中国における大型モデル技術の普及を推進してきたと言える。

さらに、Zhipuは今年、ベースモデルやマルチモーダルモデルを含む新世代の製品をオープンソース化し、その技術の範囲をさらに拡大する予定であることが分かっています。

さらに、市場の観点から見ると、Zhipu が資本から認められるのは今回が初めてではありません。

昨年12月、Zhipuは30億人民元の資金調達を完了し、そのわずか2か月後には杭州からさらに10億人民元の資金を調達した。

さらに昨年9月には、中関村科学城がZhipuへの投資を主導すると発表し、投資前評価額は200億元に達しました。Zhipuは中国で初めて、評価額が200億元を超える大型モデルスタートアップ企業です。

さらに、Zhipu の商業化の道筋は明確で、「モデル・アズ・ア・サービス (MaaS) + プライベート展開 + インテリジェントエージェントプラットフォーム」という多角的なモデルを形成し、高い商業価値と安定した発展性を備えた大規模な開発者エコシステムを構築しています。

したがって、杭州が Zhipu を選択した理由は、基本的に、技術的な自立性、生態学的な開放性、最先端の先見性、商業的な実現可能性という 4 つの論理に基づいています。

この投資は単なる資本移動ではなく、杭州が「中国一のデジタル経済都市」となるための重要な一歩であり、AI時代における同市の競争力を再構築すると期待されている。

次なるDeepSeekとなるでしょうか?

AI 競争の世界的状況において、 「DeepSeek の瞬間」は大規模モデル分野の聖杯となり、技術革新、エコシステムの再構築、商業的価値の共鳴を象徴しています。

Zhipuの主任科学者である唐潔氏も昨日、Weiboで公に次のように述べた。

DeepSeekの成功は、産業界の熱意を掻き立てただけでなく、学術界にも大きな弾みを与えました。大学や研究機関は、大規模モデルの基礎理論と技術の重要性を改めて認識しました。大学は特に理論研究への投資を増やしており、AGIの本質の理解は手の届くところまで来ているようです。さあ、共に進みましょう!AGIはマラソンです。ペースを調整し、エネルギーを賢く配分し、前向きな姿勢を維持することが重要です。

上記の要約に基づくと、Zhipu は中国で非常に包括的なプレーヤーであると考えられており、DeepSeek と同様に、オープンソースとコスト削減の原則を順守しています。

都市に必要なのは、単なる技術のスターではありません。チップメーカー、開発者コミュニティ、業界ユーザーを結び付けることができるエコシステムレベルの企業も必要です。

杭州市がZhipuを選択したという決定から判断すると、Zhipuはこの「気質」に適合した企業であると言える。

産業革命の歴史をより広い視点から振り返ると、文明の進路を真に変えたのは、単一の技術革新ではなく、むしろ技術の普及によって引き起こされたシステムの変化でした。

したがって、Zhipu が世界規模で新たな「DeepSeek の瞬間」を作り出すことができるかどうかよりも、より体系的な「Zhipu の瞬間」を作り出すことができるかどうかに期待すべきなのかもしれません。

この点に関して、Zhipu は独自の計画を持っており、将来を見据えた AGI 階層型アーキテクチャを提案しています。

L1 は事前にトレーニングされた大規模モデルであり、膨大な量の知識が収束する知識の「スーパー鉱山」のような基盤として機能し、AI 開発の強固な基盤を築きます。

L2はアライメントと推論の段階であり、「インテリジェントな活性化」の瞬間とも言える。人間と機械の意図を正確に一致させ、テキスト、画像、動画、音声といったモダリティ間のアライメントを実現する一方で、機械が人間のような推論と計画能力を習得できるようにすることで、機械に機械的な思考を放棄させ、インテリジェントな変革を始動させる。

L3自己学習段階への発展により、AIは大きな飛躍を遂げました。これまで、L1とL2は学習に人間の指導に依存していました。この段階では、AIは自己批判、反省、そして熟考さえも学習し、オープンドメインの問題に対処できるようになります。未知の課題に直面しても、人間のように繰り返し試行錯誤を繰り返し、解決策を模索することができます。

L4 自己認識段階では、AI は重要な新しい能力を獲得します。つまり、自身の行動と意思決定の結果を明確に説明し、因果関係を理解し​​、知能の説明可能性を向上させることができるようになります。

レベル5の意識知能は、AGIの頂点を極めるものです。最終的には「機械科学の発見者」の究極の形を実現し、AIは既知の問題を解決するだけでなく、人間の科学者のように独自の科学的仮説を提案できるようになります。

結論として、Zhipu は間違いなく、今年の国内 AI 開発において注目に値するプレーヤーの 1 つです。