618ZXW

視覚技術分野の有力者がスマートカー戦場に「パラシュート降下」した。顔認識技術で名声を博した清華大学ヤオ・クラスの卒業生が、重慶の老舗自動車メーカーを買収したのだ。

競争が激しい中国のスマートカー市場に、2024年末に大手企業が登場した。

同様に素晴らしい才能を持つ、清華大学の「姚クラス」卒業生の彼は、2011年に起業し、資本と業界から追い求められる中国初のAIスターユニコーンを生み出した。

AIビジョン派にも属し、自動運転が普及する数年前から、チームを率いてエンドツーエンドのTransformerマルチターゲット追跡ソリューションを提案し、セキュリティ、輸送、イ​​ンフラなどの業界で応用されています。

昨年、彼のチームは蓄積したアルゴリズムと基本的なAI機能により、自動運転に関する一連の学術会議やコンテスト、そして車両の量産化の進展において名を馳せた。

彼は、Megvii Technologyの創業者、Yin Qi氏です。彼は今、新たな身分と肩書きを持ち、重慶力帆汽車の新社長兼会長に就任しました。

AIユニコーンのリーダーが自動車メーカーを買収

力帆科技は11月11日、殷其氏を同社の第6代取締役会の会長に選出する発表を行い、一方で吉利グループのベテランである周宗成前会長は退任した。

Megvii Technologyの事業登録情報も11月に変更され、法定代表者がYin Qi氏からもう一人の共同創業者であるTang Wenbin氏に変更された。

これに先立ち、7月1日、殷奇氏は有限責任社員として江河舜水を設立しました。7月2日、力帆科技は株主異動を発表しました。殷奇氏は、自身が実質的に支配する江河舜水を通じて、力帆科技の株式合計9億株を24億3000万人民元で取得し、力帆の第二位株主となりました。

Yin Qi 氏のアイデンティティも、中国の第一世代の AI 起業家の一人から自動車会社のトップへと変化しました。

彼が選んだ力帆グループは、重慶市に拠点を置く最古の自動車メーカーの一つです。1992年に設立され、瑞蘭汽車(吉利汽車と力帆科技の合弁会社)、力帆オートバイ、力帆通産などのブランドを所有しています。

力帆は早くから新エネルギー車市場に参入しましたが、先行優位性を競争優位に転換できず、一時は危機に陥りました。しかし、2021年に構造改革を完了し、通常の経営体制に戻り、「スマート化」時代後半のビジネスチャンスを積極的に模索し始めました。

私たちにとって、Yin Qi(イン・チー)はより馴染み深い存在です。1980年代後半に生まれ、安徽省蕪湖市出身です。2010年に清華大学姚奇之実験クラスを卒業し、その後香港中文大学に留学しました。2011年には、コンピュータサイエンスの博士号取得のため、アメリカのコロンビア大学に留学しました。マンハッタンで学んでいる間に、Tang Wenbin(タン・ウェンビン)とYang Mu(ヤン・ム)と共にMegvii(メグビー)を共同設立しました。

コンピュータービジョン技術はMegviiの切り札であり、当時AIスタートアップの前例がなかったチームが成功を収め、最初の金メダルを獲得する原動力となりました。同社は、インフラ、アルゴリズム、アーキテクチャ、そしてハードウェア能力を完備した「プラットフォーム型」AI企業へと着実に成長を遂げています。

現在のコンピュータービジョン技術の発展と応用動向を考えると、Megvii TechnologyあるいはYinqiが何らかの形で自動車インテリジェンス分野に参入することはほぼ必然と言えるでしょう。しかし、Yinqiが実際に発表したタイミングと方向性は、やや予想外のものでした。

まず、銀奇氏は以前述べたように確かに「物理的なAI」を実現したが、それは2024年に資本家に認められる可能性が高い具現化された知能ではなく、むしろ「ホットなトレンド」が過ぎ去ったように見えるインテリジェントカーである。

さらに驚くべきはその手法だ。普通のサプライヤーになることでもなければ、自動車会社に「入社」することでもない。創業者が自ら自動車会社を引き継ぎ、全責任を負うという、史上初の試みなのだ。

これを理解するには、まずMegviiの自動運転事業の歴史的発展から始める必要があります。

Yin Qi のゲームへの参加は十分に準備されていました。

Yin Qi氏は学部生時代にMicrosoft Research Asiaで長期間インターンシップを行い、顔認識プロジェクトに深く関わっていました。Megviiは創業当初、顔認識アルゴリズムで名声を博し、その精度は当時Facebookのアルゴリズムを上回っていました。

その後、Megvii はこのアルゴリズムに基づいて、顔認識、OCR テキスト認識、セキュリティ、金融などのソリューションを含む Face++ プラットフォームを開発しました。

2020年以前は、CNNアルゴリズムに基づくこの視覚認識ソリューションが自動運転の主流でした。Megviiはこれを注意深く監視し、フォローアップしていましたが、製品ソリューションのリリースを急いでいませんでした。

Megvii の基本的な判断は、従来のアルゴリズムでは高度な自動運転の問題を解決できないというものです。

CNN の核心は畳み込みとプーリングであるため、2 次元のローカル データ間の相互関係に焦点を当てるのに適していますが、複雑な交通ゲーム シナリオで必要な能力であるグローバル データ内の各セマンティック (オブジェクト) 間の相関関係を学習するのは得意ではありません。

そのため、2020年以前は、視覚データは補助的な用途にとどまっており、インテリジェント運転機能のほとんどはミリ波レーダーに依存していました。しかし、ミリ波レーダー自体には限界があり、精度の限界、物体の高さ情報の不足、そして最も重要なのは静止物体の認識能力の低さです。

従来のRV(レーダー+ビジョン)アルゴリズムでは、高度なインテリジェント運転問題を解決することが難しく、また、Megvii独自の利点はコンピュータービジョンアルゴリズムに集中しているため、Megviiは技術革新を待ち望んでいました。

2020 年にテスラが初めて BEV アルゴリズムを Transformer アーキテクチャに統合するまで、純粋なビジョンベースのアプローチへの道が突然開かれました。

2021年、Megviiは正式にインテリジェント運転ビジネスチームを設立し、2022年にはMegvii研究所がTransformerベースのマルチビュー3D物体検出アルゴリズムPETRを提案しました。

昨年、PETRv2 モデルに基づく Megvii のソリューションは、CVPR 2023 の自動運転認識および意思決定システム部門で OpenLane Topology Challenge を受賞しました。

Megvii は、PETR シリーズの大規模モデルのほか、BEVDepth 検出モデル (3D ターゲットの高精度な深度推定が可能)、LargeKernel3D (3D ビジョン タスクに対する大規模畳み込みカーネルの実現可能性と必要性​​を初めて証明)、BEVStereo (最先端の 3D オブジェクト検出用 nuScenes ピュア ビジョン ソリューション) などもリリースしており、いずれも業界をリードする技術的成果です。

2023年8月、Megviiはセンサー構成とコンピューティング能力に基づいて3つのカテゴリーに分けられた量産計画を初めて公表しました

標準バージョンは、基本的な高頻度のインテリジェント運転シナリオに対応し、レベル2のすべての機能を備えています。その最大の特徴は、その優れた機能にあります。標準機能には、自動駐車、メモリーパーキング、高速道路/高架道路におけるNOP機能などが含まれます。標準バージョンは、10万元から15万元の価格帯の車両向けに設計されています。

プロフェッショナルバージョンは、標準バージョンにCity NOP機能と車線横断安全駐車機能を追加したモデルです。15万元から30万元の価格帯の車両向けに設計されています。

また、30万元以上の価格帯の車両向けには、より高い冗長性を提供し、「強化された都市NOP」機能を可能にするフラッグシップバージョンのソリューションも用意されている。

Megvii のインテリジェント ドライビング ソリューションは、「エントリーレベルのインテリジェント ドライビング」の基準を極めて高いレベルに引き上げると同時に、同じ技術仕様のハードウェア コストをこれまでにないほど低く抑えます。

さらに、2023 年 8 月、Megvii のソリューションは、おそらく業界で初めて「低い計算能力、高い機能性」を明確に定義しました。

公式情報によると、横並びの比較では、Megvii の標準ソリューションでは、高速 NOP 機能を実現するために、主流の NVIDIA Orin (約 40~50 TOPS) の 1/5 または 1/6 の計算能力しか必要としません。

Megviiの市場参入は比較的遅かったものの、これは高度な自動運転技術の導入という現在のトレンドと完全に一致しています。「極めて高い費用対効果」を実現できた主な理由は、アルゴリズム、コンピューティング能力、そしてツールチェーンの蓄積にあります。

元のアルゴリズムは、主に BEV を実装する 2 つのアルゴリズム モデル (BEVDepth シリーズと PETR シリーズ) で構成されます。

一部のチップが Transformer 演算子を適切にサポートしていない場合は BEVDepth を使用できます。また、チップが Transformer 演算子を適切にサポートしている場合は PETR を使用できます。

コンピューティング インフラストラクチャの面では、Megvii はこれまでに 10,000 枚以上のカードを備えたコンピューティング クラスターを構築しており、その迅速な反復機能は大規模モデルの強さの基盤でもあります。

一方、コスト削減のため、Megviiは様々な車種に適応するインテリジェント運転システム向けの統一BEVアルゴリズムフレームワークを採用し、アルゴリズムのプラットフォーム化とハードウェアのプラットフォーム化を実現しました。これにより、OEM各社の様々な車種の量産スピードが大幅に加速し、品質向上とコスト削減が実現します。

したがって、Megvii と Ingenic がスマートカー市場に参入できたのは、実際には両社の蓄積された技術と成熟したソリューションによるものです。

2024年、Yinqiの「物理的でありながらインテリジェントな車にAIを搭載」戦略は、完璧なタイミング、場所、人材を備えていると言えるでしょう。

まず、タイミングが適切です。Megviiのビジョンベース技術は、現在、その実装において業界チェーンから最高のサポートを受けています。特に、まだ初期段階にあり、ソフトウェアとハ​​ードウェアのソリューションが明確でないエンボディド・インテリジェンスと比較すると、その優位性は際立っています。

さらに、中国における先進的なインテリジェント運転システムの普及率は依然として非常に低い。オープンソース・セキュリティーズの調査レポートによると、今年末の普及率は5%程度と予想されているものの、普及率は加速しており、2025年までに100%の成長が見込まれている。

これは、ベンチャーキャピタリストの目にはスマートカーはもはや「ホットなトレンド」ではないものの、業界の観点からは勢いを増し始めたばかりであり、市場は依然として非常に大きいことを示しています。

第二に、人間的要素があります。Megviiの技術力と価値は、自動車の知能化の波の中で実現される大きな可能性を秘めています。

最後に、立地の優位性があります。重慶市はインテリジェントカーの波に積極的に取り組み、その強固な自動車産業チェーンと相まって、力帆汽車に独自の優位性をもたらしています。最も重要なのは、再現が難しい様々な歴史的状況下において、力帆汽車が比類のない特徴を備えていることです。

Yin Qi の Lifan への加入はどのような影響を与えるでしょうか?

自動車会社を「買収」することは、優れたインテリジェントドライビングサプライヤーになるための必須条件ではなく、「ソフトウェアとハ​​ードウェアの統合」をうまく行うための必須条件でもありません。では、Yin Qi氏の選択をどう理解すればいいのでしょうか?

もちろん、競争上の要素はあります。Megviiの技術力は、特にインテリジェント運転における競合他社の排除競争において、早急に実証される必要があります。将来の競争のベンチマークとなる、先進機能を備えたフラッグシップ製品が必要です。

Yin Qi氏がLifanの舵取りを担う以上、同社の現行モデル、あるいは将来の新モデルやブランドがMegviiのインテリジェント運転ソリューションを第一の選択肢として選ぶのは当然だ。

従来の OEM およびサプライヤー モデルと比較して、商用入札、チームの統合と調整、プラットフォームのハードウェアとソフトウェアの適応にかかるコストが大幅に削減されます。

さらに重要なのは、力帆汽車自体が自動運転の実現にとって最適な「価値ホットスポット」であることだ。

以下の条件を同時に満たしているからです。

自動車業界自体は比較的「弱い」ため、将来的には製品や戦略の転換が容易であり、AIのバックグラウンドを持つチームが主導権を握るのに適しています。

重慶は強力な地元産業条件も備えており、新技術の波によって磨かれたそのインテリジェント車両サプライチェーンは、力帆の将来の変革を十分サポートする能力を備えています。

力帆は歴史的重荷を捨て去り、積極的に突破口を探している。

その背後には重慶市政府と吉利汽車の全面的な支援がある。

インテリジェントカーの競争において、力帆の「早期」参入と曁蕩の「後発」参入は、この組み合わせを巡る疑念の根拠となっている。どちらも妥当な理由だが、その背後にある独自のチャンスと稀有なWin-Winの関係もまた、見落とされがちである。

「Megvii + Lifan」モデルは、すでに奇跡を起こしている重慶を拠点とする別の組み合わせ、「Huawei + Seres」と多くの類似点を持っています。

自動車メーカーは、業界トップの AI チームの先導のもと、インテリジェント テクノロジーへの扉を開き、最下位からトップへと躍進し、多くの従来の OEM が長年に渡って乗り越えられなかった変革の道を完成させています。

このグループのスマートカー技術サプライヤーは、絶対的に先進的な技術を使用して自動車会社と車種に浸透し、徐々に Android 効果を形成しています。

したがって、Yin Qi の一見予想外の選択は、実際には他のプレーヤーが長い間見逃していたまれな機会を最も適切なタイミングで捉え、Megvii のテクノロジーと天才たちに実装のための最良のチャネルと舞台を提供しました。これは、従来のインテリジェント運転サプライヤーがこれまで実現するのが困難だったことです。

重慶市は依然として勝利の立場にあり、この勝利の立場は自動車産業そのものの範囲をはるかに超えています。

Megvii のテクノロジーは、重慶のシナリオと産業、そして Geely のプラットフォームと組み合わされ、完全なロボタクシーとロボット産業チェーンを実際に構築しました。

合肥は自動車の新エネルギー時代の最大の勝者であり、一方重慶はインテリジェント車両時代ですでに大きく先行している。