|
最新のV13バージョンのインテリジェント運転技術が中国で発売されました! これはFSDの未来バージョンではなく、 Li Autoが発表したエンドツーエンドのインテリジェント運転バージョンV13です。 「駐車スペースから駐車スペースへ」、「介入ゼロに近づいています」、「800 万クリップのトレーニング データ」... 2025年の初めに、エンドツーエンドのソリューションでインテリジェント運転の第1層に加わったLi Autoは、その進歩を再び加速させました。 今年は、巻いて準備していきましょう! Li Auto V13 にはどのような変更が加えられましたか?FSDと同じ名前なのは単なる偶然です。Li Autoは、これがエンドツーエンドのイテレーションにおける13番目のメジャーバージョンでもあると発表しました。MAXモデルは本日発売されたばかりで、インテリジェントドライビングのバージョン番号はAD Max V13.0です。 全体的なハードウェア構成には、500 TOPS を超える計算能力を備えた 2 つの NVIDIA Orin X チップ、1 つの 128 ライン高解像度 LiDAR、6 台の 8 メガピクセル HD カメラと 5 台の 2 メガピクセル カメラ、および 5 台のミリ波レーダーが含まれます。 L9、8、7、6、およびMEGAのMAXバージョンはすべて同じです。 正式リリースの前に、すでに多くのベータ テスターが Ideal User Community に直接の体験をアップロードしていました。 たとえば、ユーザー @PeterGrey は夕方のラッシュアワー中にこれを経験しました。 ユーザーが最も認識しやすいハイライトの 1 つであり、今年の「次世代」インテリジェント運転技術を定義する機能でもあるのが、車に実装された駐車スペースから駐車スペースへの機能です。 ユーザーが住宅団地の地下駐車場の入口に近づくと、 AD MaxシステムはCity NOA(No Address Allocation)からAutonomous Memory Parking(AVP)へとシームレスに切り替え、駐車スペースへのスムーズな旋回を実現します。最も印象的なのは、システムが自動で回転式改札口を通過できるようになったことです。 これは、AD Maxが高速道路の料金所を自律的に通過できることも意味します。 地下駐車場に入ると、車両はまず180度Uターンし、その後駐車スペースへと直進し、その過程で不規則な形状をした様々な耐荷重柱や壁、歩行者をうまく回避した。 最後に、一連のスムーズな駐車操作があります。これは、本質的に難しいものではありませんが、インテリジェントな運転と駐車の体験全体に関連しており、ユーザーに非常に実用的で魅力的なものを提供します。 公道においても、AD Max V13.0は驚くべき改善を見せています。 別のユーザー @陈伟有理想 は、建設中の高速道路の区間を大型車両が走行する中、AD Max V13.0 が動作するビデオをアップロードしました。 当初、このシステムは低速のトラックを追い越していました。「低速車両に追従せず」、大型車両に道を譲るという戦略は、ほぼすべてのNOA(先行車追従禁止システム)で採用されています。しかし、追い越しが完了する前に、道路工事により道路が封鎖されました。 AD Max V13.0は、コーンを避けるため、素早く右へ車線変更し、約3~5分車間距離を保ちながら、不快な急ブレーキもかけずに走行しました。まるで追い越しと回避を同時にこなしているかのようでした。 より強力な「エンドツーエンド」の側面は、システムが効率優先のアプローチをより柔軟に実装するようになることです。 以前は、2キロ手前で一番右に車線変更し、前方に遅い車がいても追従していました。 しかし、システムは可能な限り右側から遅い車両を追い越そうとし、車線が実線になる直前に素早く合流するようになりました。このユーザーのテストケースでは、その距離は600メートルでした。 エンドツーエンドのメリットは、都市部の道路においてさらに顕著になります。例えば、AD Max V13.0は、複数の高架下に位置し、車両、歩行者と車両、そして二輪車間の様々な相互作用を伴う、不規則で複雑な環状道路にも対応できるようになりました。 上記のさまざまなテスト画像から、Ideal AD Max V13.0 のもう 1 つの大きな変更点であるAI 視覚化が実際に確認できます。 まず、右側には 10 個の可能な運転ルートとその確率がリアルタイムで表示されます。 ルートの一貫性が高いほどシナリオは単純になり、逆に一貫性が低いほどシナリオは複雑になり、ルート選択の不確実性が高まります。これにより、エンドツーエンドの思考プロセスが直感的かつ包括的にユーザーに提示され、信頼感が向上します。 2 つ目の視覚化機能は、 「ヒートマップ」アテンション システムです。これは、システムが現在注目しているターゲットの優先度を示します。ターゲットが赤いほど、システムが現在割り当てている注意が多くなり、インテリジェント ドライビング システムの「防御運転」戦略を直感的に確認できます。 最後に、画面の右端にはインテリジェント運転翻訳機があり、Li Autoが独自に開発したVLM(ビジュアル言語モデル)を使用して、インテリジェント運転システムの戦略をリアルタイムで説明し、提案を提供します。 複雑で高度なインテリジェント運転技術とインテリジェント運転システムの意思決定プロセスの「ブラックボックス」を公開し、翻訳を通じて分かりやすく解説します。 何の役に立つの? これにより、インテリジェント運転に対するユーザーの信頼と親しみが大幅に高まり、使いやすさだけでなく、それを「愛用する」理由も増えます。 インテリジェント運転分野のほぼすべてのプレーヤーは、コーナーケースに固執し、それがユーザーがインテリジェント運転システムを信頼できない根本的な障害であると考えています。これは確かに事実ですが、純粋にエンジニアリング志向の考え方を反映しています。 製品体験、ユーザーの心理的受容、認識をどのように向上させるかについて考えた人は誰もいません。 「ユーザーの理解」と製品体験に関しては、Ideal が間違いなく最高です。 800 万回のトレーニングクリップを備えた Ideal V13 はどのレベルですか?Li Autoの最新のAD Max V13.0システムの公式仕様には、次のような新しい説明があります。 800 万個のトレーニング データ クリップ。 それはどういう意味ですか? クリップとは、時間特性を持つ運転映像データのセグメントです。クリップの長さは通常約30秒で、数億キロメートルに及ぶ実データから厳選された「五つ星ドライバー」データで構成されています。同時に、データアノテーションプロセスとモデルトレーニングプロセスは完全に自動化されています。 これは、「システムがXXフレームのデータを学習する」というこれまでの自動運転の説明とはまったく異なります。 これは、業界全体の技術的パラダイムの大きな変化を反映しています。 理想的な AD Max V13.0 では、これが「1 つは高速、1 つは低速」のデュアル システムに反映されています。 高速部分は、リアルタイムの運転タスクを処理するエンドツーエンドモデル自体であり、確率的なルートと注意を表示する可視化画面の左側の部分です。低速部分は、常識を学習し、潮汐レーンなどの未知の道路状況に対処するために使用される VLM 大規模モデルであり、画面の右側のリアルタイム説明部分に対応します。 エンドツーエンドコンポーネントは、認識、意思決定、計画を担い、AIドライバーの中核を担います。さらに、ファーウェイのアプローチとは異なり、Ideal End-to-Endは階層構造のない、より直接的なワンモデル構造を採用しています。 センサーデータを入力し、車両の走行軌跡を直接出力します。 ワンモデル分野ではテスラが代表的な存在であり、中国のセンスタイム傘下のユニアドもこの路線を選択し、量産前夜を迎えている。 VLMは本質的にマルチモーダルな大規模モデルであり、その機能はインテリジェント運転のための「ポイント・アンド・リード・マシン」として機能することです。理解できない部分を指摘し、大規模言語モデルの認知能力を活用してシーンを理解し、エンドツーエンドのモデル参照と修正のために別の運転軌跡を出力することができます。 なぜそうするのでしょうか?理想的な説明は、エンドツーエンドモデルは人間の成熟した運転経験から直接学習しますが、ブラックボックスの意思決定プロセスは未解明のままであるということです。誤検知や誤検知、そして幻覚の問題は、直接的なパラメータ調整では解決が困難です。 したがって、エンドツーエンド モデルの動作を制御するには、「ポイント アンド リード マシン」と適切な強化学習手法を追加する必要があります。 Li Autoのエンドツーエンドのインテリジェント運転技術を要約すると次のようになります。 最大の違いは、中国で主流となっているマルチセグメント構造ではなく、テスラワンモデルと同じワンステップ方式を採用していることで、量産進捗も中国で最も早い。 しかし、Li Auto と Tesla の違いは、XPeng、NIO、SenseTime などのプレーヤーと同様に、言語モデルに基づくマルチモーダル モデルを認知能力の補足として使用することを選択している点にあります。 もう 1 つのポイントは、エンドツーエンド モデルには 4 億〜 5 億のパラメーターがあり、VLM の合計には 22 億のパラメーターがあり、既存の Orin チップを搭載したさまざまな MAX モデルに完全に展開できることです。 最後に、反復の革命的なスピードがあります。 AD MAX システムは 4 か月以内に、ベテランドライバーの約 64,000 時間の運転経験を学習しました。 Li Autoの加速は何を反映しているのでしょうか?2024年末から2025年初頭にかけて、インテリジェント運転は新たな速度記録を樹立するでしょう。 BYD、XPeng、NIO、Li Auto…いずれも成長を加速させている。 例えば、XPengは年末にParking Space Pioneer Editionの小規模テストを実施しました。NIOのLi Bin氏は、今年はハイエンドのインテリジェント運転の安全体験に重点を置くことを明らかにしました。DJIとBYDは、10万レベルのモデルで費用対効果の高いソリューションの普及に注力しています。JiKeは、2024年12月31日にKPI主導の納品も行いました。 各社はそれぞれ異なる技術ルート、ハードウェアソリューション、そして価格帯で車両を提供するでしょうが、最終的に重要なのは、ユーザーに提供できる実現可能な機能です。2024年12月31日を見据えると、最先端のインテリジェント運転技術、つまり次世代は、社内テストまたは限定的な公開テストの完了時に技術的成熟度を示し、完全自動駐車体験を提供できるようになるでしょう。 第二に、都市部で NOA を実現できる次世代、高速道路や環状道路で NOA を実現できる現世代、そして主に L2 しか備えていない「時代遅れの世代」があります。 言うまでもなく、テスラは中国市場において最もユニークな存在です。同社の次世代完全自動運転(FSD)技術は、中国ではまだ公道走行の承認を受けていません。しかし、マスク氏の先進的なアプローチと揺るぎない技術への取り組みにより、既に公道を走行しているすべてのテスラは、あと1回の無線(OTA)アップデートだけでFSD対応が可能になるでしょう。エンドツーエンドのパラダイムをいち早く実践し、駐車スペースから駐車スペースへのソリューション実現のリーダーであるテスラは、特別な存在であり、中国のインテリジェントドライビング愛好家にとって非常に重要な存在です。 しかし、駐車スペースから駐車スペースまでのインテリジェント運転技術の実装により、インテリジェント運転の起点と終点はすでに到達しています。 残っているのは、プロセス全体を通じた製品体験とユーザー体験であり、これが Li Auto が潜在エネルギーと運動エネルギーの変換を急速に実証している主な理由でもあります。 実は、Li Autoが自動車の製造を開始して以来、インテリジェント運転で名を馳せてきたわけではありませんが、現在の観点から見ると、その優位性はますます明らかになっています。 まず、自動運転の核となるのは、単なる運転タスクではなく、AIを活用した大規模モデルと汎用的な機能です。世界的に見て、独自の大規模基本モデル基盤を開発している自動車メーカーは、テスラとLi Autoのみのようです。 Li AutoはVLM、マルチモーダル、インテリジェント運転モデルの統合を明確に表明することで、業界で第一歩を踏み出しました。 第二に、今日の視点から見ると、Li Autoの自動車製造における「型にはまった」アプローチは、単なるコスト削減のためではないことは明らかです。同一の設計は、同一のセンサー配置と、その基盤となるハードウェアソリューションの統一につながります。 AI ソフトウェアの観点から見ると、ネストされた人形は同じモジュール、統合されたソリューション、インターフェース、データを備えたハードウェア ビークルを直接作成し、反復処理をより効率的にして規模の経済性を実現します。これは、スケーリングの法則が適用される今日の世界ではさらに重要です。 第三に、Li Autoは当初からインテリジェント運転の分野への野心を明らかにしてきました。 Li Auto ONEを皮切りに、Li Autoのインテリジェント運転機能は標準装備であるだけでなく、無料で提供されるため、ユーザーの参入障壁が低くなり、車のオーナーはシャドーモードのイテレーションに最も直接的に参加できるようになります。これらの機能を標準装備にせず追加料金を請求する業界のアプローチと比較すると、Li AutoはAIイテレーションの本質を端から見据えており、これは長期的に見て有益です。 多くの人が、なぜLi Autoが2024年に突然、インテリジェント運転機能においてこれほど大きな飛躍を遂げたのか疑問に思っている。詳しく調べてみると、答えはLi ONEの企画と実行にある。 しかし、すべての標準的な無料のインテリジェント運転ソリューションが、インテリジェント運転能力の大幅な飛躍に十分かつ必要な条件となるわけではありません。その理由は単純です。 十分な販売実績をあげ、十分な数の車を路上に走らせ、十分な有効かつインテリジェントな運転走行距離を蓄積する必要があります。 Li Autoはこれを実現しました。まずはONE世代が勢いを増し、次にLシリーズが販売を牽引しました。販売が急増した後、インテリジェント運転やAIに必要なデータ規模が、Li Autoのリソース、勢い、そして潜在力となりました。 インテリジェントな運転への道は無数にありますが、第一原則はただ 1 つ、データです。 結局のところ、AIの第一原則はデータです。 マスク氏はこの原理をいち早く理解したため、グーグルのウェイモとは異なる自動運転実現の道を選び、早くも優勝の可能性を示している。 Ideal もこの原理を理解していたようで、早い段階でセンサー、ハードウェア、ソフトウェア ソリューションの統一された標準化されたレイアウトを開始し、エンドツーエンドのパラダイムの変化に追いつき、 「データ駆動型」のコア エンジンに完全に適合し、スケーリング法則がその役割を果たすようにしました。 したがって、インテリジェント運転の理想的なパフォーマンスと影響は、まだ始まったばかりかもしれません。 実際、インテリジェント運転の理想的なレベルを評価するには、もう 1 つの、より「客観的な」側面があります。 ファーウェイの「はるかに先進的な」インテリジェント運転機能とマーケティングの勢いにより、ファーウェイ搭載モデルはLi Autoと熾烈な競争を繰り広げています。どちらもファミリー向けSUVで、レンジエクステンダー機能付きの電気自動車オプションも備えていますが、Li Autoは月間販売台数5万台を維持しており、完全に打ち負かされたわけではありません… これはインテリジェント運転の理想的なレベルをほぼ最も直接的に反映したものです。 もう一つ最後に、もう一つ興味深い点があります。 テスラのオートパイロット担当シニアエンジニア、ユンタ・ツァイ氏は、ChatGPTのようなインターネットベースのAIはミリ秒レベルの遅延には敏感ではないものの、自動運転やロボティクスではスループットと遅延のバランスを取る必要があると述べました。そのため、システムには2つのレベルが存在します。 低レベルの機械制御では、ロケットエンジンのように、わずか数マイクロ秒しかなく、コースから外れる前に推力を調整する時間はほとんどありません。別の高度なシステムが、重要な決定を下す前にすべての情報を収集する必要があります。 これは理想的な高速低速システムと驚くほど似ているため、テスラの FSD も同様のアーキテクチャを採用したとしても不思議ではありません (発表されたことはありません) 。 |
Ideal Intelligent Driving の切り札: 駐車スペースから駐車スペースまでの全プロセスがオンラインで行われ、ゲートの通過も自動で行えます。
関連するおすすめ記事
-
今すぐ5090をチェックしてください!Nvidiaは、一部のグラフィックカードにROPが欠落しており、Nintendo Switchなどの古いデバイスでのゲームプレイに影響を与えるという欠陥を正式に確認しました。
-
11の指標でGPT-4oを上回る!360の共同作業により、16社の大型モデルメーカーが集結し、最強の「六角形の戦士」チームを結成。
-
大規模モデルを微調整するプロセス全体について考える
-
限られたウェット実験データを用いてタンパク質言語モデルを微調整するにはどうすればよいでしょうか?浙江大学のチームの研究成果がNeurIPS 2024に選出されました。筆頭著者が設計プロセスを説明します。
-
わからないところはスキャンして!世界最強の数理モデルが公開されました。デモ版は誰でも試すことができます。Alibabaのマルチモーダルモデルを搭載し、中国語版もご用意しています。
-
OpenAIの最も秘密主義的なAIスタートアップの元CTO:名前も方向性も不明、そしてOpenAIの幹部を引き抜いた