618ZXW

VLA がインテリジェント運転競争のルールを書き換え、NVIDIA の支援を受けてダークホースが 4 か月で 10% の市場シェアを獲得。

「最初の賢い人たちはすでに渋滞に巻き込まれている。」

年末が近づくにつれ、このトピックが検索トレンドのトップに躍り出ています。視聴者の皆さん(dogeさん)もその一人でしょうか?

しかし、車の所有者の中には、インテリジェント運転技術を持てて幸運だったと感謝する人もいた。

車両における AI の利便性とパワーはますます明らかになっています。

長距離の移動でも短距離の通勤でも、疲れを知らない AI ドライバーはドライバーの疲労を軽減し、先進技術に基づいて常に進化しています。

初期の CNN から、認識を担う後期のトランスフォーマー、そして現在では全体的な制御を担う VLM のエンドツーエンドの組み合わせまで、AI は旅行体験を常に向上させています。

しかし、インテリジェントな運転技術と体験の変革は、これで終わりではないかもしれません。むしろ、より大きなチャンスをもたらし、レースのルールを書き換える可能性さえあります。

なぜなら、年末には、全く新しい技術パラダイムが形成され、大手企業が大成功を収め、業界がそれに追随し、徐々にコンセンサストレンドになりつつあるからです…この技術パラダイムとは…

VLA

今年利用可能になる VLA とは何でしょうか?

いわゆる「VLA」は、Vision-Language-Action Model(視覚・言語・行動モデル)の略です。

2023年にDeepMindによって初めて提案され、ロボット工学の分野で応用されています。テキストと視覚データを入力として、ロボットが実行できる動作を出力し、物理世界と相互作用するAIの遺伝子を自然に受け継いでいます。

これは最近、自動運転の分野で人気が高まっており、一部のプレーヤーからはエンドツーエンドの次の段階と見なされています。

2025年「VLA打ち上げの年」としても知られています。

VLA は、既存の VLM (Vision-Language Model) に多少似ています。

この2つの違いは何でしょうか?

全体的なフレームワークの観点から見ると、VLAモデルはVLMとエンドツーエンドモデルを組み合わせたものと捉えることができます。マルチモーダルな大規模モデルは、もはや「運転中に監視する」といった単なる時折のリマインダーではありません。

代わりに、一流の AI エキスパートが自ら主導権を握り、長時間オンライン状態を維持し、直接「あなたに代わって運転」します。

具体的な機能面では、 VLAモデルの一般化能力がさらに強化され、インテリジェント運転システムはプロセス全体を通じて微分化可能となり、システムの推論プロセスをユーザーに示し、なぜこのように運転するのかを説明できるため、ユーザーはインテリジェント運転システムをもっと信頼できるようになります

VLA がこれほどの進歩を遂げたのはなぜでしょうか?

鍵となるのは、VLAが思考連鎖を導入し、「人間のような」思考を実現することです。これにより、モデルはグローバルコンテキストを通じて複数の道路状況情報を理解し、他の車両と常に相互作用しながら、最も安全な最適なソリューションを導き出すことができます。

具体的には、VLA の実装を先駆けた DeepRoute.com によると、VLM は約 7 秒先までの道路状況しか予測できないのに対し、VLA は数十秒先までの状況を予測でき、建設現場、潮流レーン、交通制御ジェスチャーなどの複雑な状況をよりよく理解できるとのことです。

したがって、VLA はエンドツーエンド パラダイムのさらなる応用であり、エンドツーエンドが新しい段階に入ったことを意味します。

これまで、業界はエンドツーエンドのコラボレーションの模索段階にあり、新しいパラダイムの実現可能性を証明していました。

現在、業界がエンドツーエンド ソリューションへの理解を深め、エンドツーエンド開発の競争期に突入するにつれ、エンドツーエンド ソリューションに対するさまざまなアプローチが登場しています。

VLAは人気のある研究分野です。

これは、中国の大手 OEM であるLi Autoや大手サプライヤーのDeepRoute.comから認められただけでなく、最初に宣伝されたものでもあります。

海外では、最近ジェミニをベースに構築されたウェイモのEMMAも、業界の専門家からVLAと見なされています。

中国では、AI機能で知られるインテリジェント運転技術のダークホース、元栄七星が代表的な存在です。同社の実行計画によると、大手自動車メーカーと量産提携を締結し、 NVIDIA ThorをベースとしたVLAモデルを搭載したスマートカーを今年中に発売する予定です。

したがって、2025 年をスタート地点として、インテリジェント ドライビング競争の新たなラウンドを見据え、VLA はインテリジェント ドライビングの第一層を競う理論的基礎の 1 つとなっています。

しかし、理論的な基礎がすべてではありません。

インテリジェント運転のための「ブロックバスターマインドセット」

インテリジェント運転の競争をリードできるのはどのようなプレーヤーでしょうか?業界では、主に以下の2つの側面を軸に新たなコンセンサスが形成されつつあります。

まず、最先端の技術パラダイムによってサポートされる必要があります。

これは2024年にすでに証明されました。

例えば、HuaweiはADS 3.0でエンドツーエンドソリューションへと移行しており、Li Autoは「VLM+E2E」を使用して追い上げており、Yuanrong Qixingは「真の図がなければ、エンドツーエンドソリューションについてどのように語ることができるでしょうか?」と提案しました。

そして、その技術を実用化できるかどうか、つまりヒット商品を生み出すことができるかどうかの実証が必要です。

自分の強さを証明するために、なぜベストセラーの製品を見るのでしょうか?

ベストセラーモデルとは、その車種がよく売れていることを意味します。

自動車メーカーにとって、大ヒットモデルを持たないことは、インテリジェント運転の分野で遅れをとることに等しい。

結局のところ、車が売れなければデータがない。データがなければインテリジェント運転はうまく開発できず、それはインテリジェント技術の競争で遅れをとることを意味する。

2024年に最も成功した例はXiaomi Carです。

Xiaomi SU7は急速に販売台数が10万台を超え、Xiaomiにデータ基盤を提供し、それを活用して自社開発のインテリジェント運転システムを迅速に追いつくことができました。

もちろん、多くの業界専門家は、すべての OEM が独自のシステムを開発する必要はなく、インテリジェント ドライビング サプライヤーを選択できると考えています。

しかし、最終的には、サプライヤーにとって、OEM と協力して大ヒット製品を生み出すことも重要です。

指定場所の数は必ずしも技術の進歩に関係するものではないと理解されています。

固定点が多いということは、そのアルゴリズムを使用している車種が多いということだけを意味し、必ずしも販売台数が多いことを意味するわけではありません

この車はベストセラーとなり、サプライヤーのアルゴリズムの反復が加速しました。

商品化の面では、OEM に利益をもたらすだけでなく、サプライヤーの強みを示し、より多くの契約を獲得するのに役立ちます。

したがって、ヒット商品を作るということは、品質を追求することであり、品質を追求することは、量を追求することそのものである

これは2024年に証明されました。

例えば、大手自動車メーカーであるLi Autoは、2024年に販売台数50万台を達成しました。特に、年後半のインテリジェント運転技術の急速な進歩により、月平均販売台数が5万台を超え、新たなマイルストーンを達成しました。同社は、人気のファミリーカーで新エネルギー車市場をリードしています。

Xiaomi AutoはSU7モデルを通じて、発売から10ヶ月足らずで13万5000台を出荷し、急速にデータを蓄積しました。わずか6ヶ月強で、都市部のNOA(Noise of Arrival:到着音)から「全国走行」へと進化し、最近ではエンドツーエンドの先駆者バージョンをリリースしました。

2つのサプライヤーも2024年に業界の注目を集めた大ヒット製品を生み出しました。

1つはHuaweiで、インテリジェントテクノロジーを活用してスマートデバイスの世界に力を与え、大きな売上を達成しています。

そのうち、文傑M7は2024年に19万台以上を納車し、文傑M9は同時期に15万台以上を納車し、高級車の新たな景観を一新した。

もうひとつの会社はYuanrong Qixingで、Weipai Lanshanの発売後の売上の急上昇を支援し、4か月以内にニッチ市場で10%の市場シェアを急速に獲得しました。

興味深いことに、インテリジェント運転業界は2022年のAI業界と非常によく似ています。以前の技術の波によって形成された状況はまだ安定しておらず、新しい技術の波の影響により、非常に短期間で破壊的な変化をもたらす可能性が実証されています。

△データ出典:企業調査、保険登録データ、車百シンクタンク研究所作成

AI分野では、かつては「辺境」のダークホースだったOpenAIが、生成AIを活用し、巨大企業Microsoftと提携することで、AIゲームのルールと状況を劇的に変革しました。インテリジェント運転分野では、同じくダークホースだったYuanrong Qixingが、エンドツーエンド技術とVLA技術を活用し、長城汽車や吉利汽車といった巨大企業と提携し、その効果と爆発的なスピードで新たな波を巻き起こしました。

生成AI革命以前から、AIは知覚分野ですでに高い成熟度を達成していました。そして、VLA革命前夜の現在のインテリジェント運転市場では、高度なインテリジェント運転が都市部にも進出し、完全なエンドツーエンドの体験まであと一歩のところまで来ています。

この質的変化は VLA テクノロジーによって推進され、大型モデルのデータがフライホイールとして機能し、スケーリング法則の影響を受けて雪だるま式に増大します。

これは傾向や予測ではなく、すでに発生した事実と現象の要約です。

都市部でのNOA爆発の前夜、私たちは大ヒット商品で成長を加速させました。

2年間の急速な発展を経て、都市部のNOAはブーム前夜を迎えています

2023年は都市部におけるNOA(通常広告)車両発売の元年と言われ、業界は必死に「都市部での発売」を推進した。

一部のプレーヤーはすでにエンドツーエンドの路上テストを開始していましたが、ほとんどのプレーヤーのインテリジェント運転アルゴリズムは依然として事前情報に依存しており、高精度の地図からまだ脱却していませんでした。

さらに、ユーザーはインテリジェント運転に熱心ではなく、統計によると、その年の都市部におけるNOAの普及率は1%未満でした。

2024年までに、自動車業界は徐々に高精度地図への依存から脱却し、「全国どこでも一夜にして運転できる」可能性を実現し、「駐車スペースから駐車スペースへ」という方向へと進化しました。

インテリジェント運転はユーザーの心を掴み始めており、高度なインテリジェント運転はインテリジェントカーの核心的なセールスポイントとなっています。店舗での試乗は、単に車の試乗であるだけでなく、インテリジェント運転製品の試乗でもあります。

今年は都市部でのNOAの導入が加速したものの、全体としては普及率が1桁台にとどまっており、都市部でのNOAは少なくとも数百万台規模の成長ポテンシャルを秘めていることがうかがえる。

なぜなら、都市部で販売されているNOA搭載車の価格は20万元を超えるものが多く、この価格帯の車が乗用車市場の約20%を占めているからだ。

中国汽車工業協会のデータによると、2024年の全国乗用車販売台数は2,756万3,000台です。20万元以上の車種のインテリジェント運転オプション率を80%と仮定すると、単純計算で今後、都市部におけるNOA(騒音・風量・自動運転)搭載の新車は年間366万台に達し、現在の数倍に達することが分かります。

したがって、都市部の NOA 市場における市場シェアをめぐる戦いは始まったばかりです。

どのような選手が目立つでしょうか?

根底にあるのは、技術的なリーダーシップと優れたユーザー エクスペリエンスです。

都市部におけるNOAの発展を振り返ると、「街を開放する」から「全国展開が可能になる」、そして「駐車場から駐車場へ」へと、ユーザーエクスペリエンスは継続的に最適化されてきました。その背景には、高精度地図から地図不要のNOA、そしてエンドツーエンドの技術パラダイムへの移行があります。

そのため、結果はまだ不透明ですが、ダークホースはそれほど多くありません。そのうち2社は新たなパラダイムを活用して急速に台頭し、2024年には最も注目されるでしょう。

その一つがLi Autoで、昨年10月23日に「エンドツーエンド+VLM」の本格展開を正式に発表したOEMです。インテリジェント運転システムの性能が向上し、ラウンドアバウト、Uターン、渋滞路、複雑な交差点などの状況において、より的確な判断を下せるようになり、より人間に近いインテリジェント運転を実現しています。

一方、システムの解釈能力も向上しています。VLMは、認識した映像を車両のインフォテインメントシステムに投影し、テキストと画像を組み合わせてモデルの運転の背後にある考え方を説明することができます。

Li Autoは2024年12月末のAIトークイベントで、次のステップとしてVLAをインテリジェント運転に活用することを明らかにした。

もう一人のダークホースは、過去に何度か技術的なトレンドを正確に予測してきた Yuan Rong 氏です。

2020年には高精度地図を廃止する計画が発表されました。2023年には、「都市開放」の流れに乗らず、「地図不要」のNOAを先行導入しました。

その後、Genrongは「ノーマップ」ソリューションをベースに、エンドツーエンドアーキテクチャによる路上テストを2023年8月に完了しました。

DeepRoute.comは、エンドツーエンドの大量生産と車両展開の後、 2024年11月初旬にVLAをインテリジェント運転プラットフォームの次の段階として使用することを提案しました。

インテリジェント運転のプレーヤーは、大ヒット商品を生み出すことでアルゴリズムの反復を加速し、最終段階に近づけています。

インテリジェント運転アルゴリズムが進化を続けるにつれ、ユーザーエクスペリエンスは絶えず向上しています。現在、最も先進的な機能は間違いなく「駐車スペースから駐車スペースへ」です。

Li Autoが最初に全ユーザー向けにサービスを展開し、続いてHuaweiデバイスも展開し、Lei Jun氏自身が参加してCEOがシステムをテストした。

多くのサプライヤーも急速に追随しています。例えば、DeepRoyal Groupは今年第1四半期に「駐車場から駐車場へ」サービスを開始する予定です。

2025年には、新しいVLAテクノロジーパラダイムと新しい「駐車スペースから駐車スペースへ」の体験により、市内のNOA線路は春節期間中の帰宅道路ほど混雑しなくなることも示されています。

VLAには依然として技術的な障壁が存在するため、OpenAIが大規模モデルの役割を宣言した時と同様に、模倣者や複製者が次々と現れましたが、結局は追随することしかできず、追い越すことはできませんでした。真の技術的洞察力を持つプレイヤーこそが、認知的配当を最初に享受したのです。

したがって、結果を予測するのは難しくありません。まだ発展途上のインテリジェントドライビング1.0フレームワークは、前半を終えて束の間の休息に過ぎません。最終的な結果を左右する後半、つまりインテリジェントドライビング2.0の競争は既に始まっています。

インテリジェント運転の VLA (車両自動化) の波で最終的な勝者は誰になるでしょうか?