618ZXW

画期的な 3nm Android AI チップがリリースされ、インターネット接続なしでビデオを生成できるようになりました。

PC グレードの Arm V9 アーキテクチャと第 8 世代 NPU を搭載した初の 3nm Android チップである Dimensity 9400 は、モバイル AI チップにおける最新かつ最も強力な成果となりました。

前世代の生成 AI チップである Dimensity 9300 と比較してAI 機能がさらに強化され、チューリッヒ ETHZ モバイル SoC AI パフォーマンス リストでトップの性能を実現しました。

Dimensity 9400は、エッジサイド DiT アーキテクチャをサポートする最初のデバイスであり、ユーザーはインターネット接続を必要とせずに、携帯電話で Sora と同じアーキテクチャを使用してビデオ生成を体験できます。

[動画は公式WeChatアカウントからご覧ください]

また、業界初のエッジサイド LoRA トレーニング機能も備えており、プライバシーを確​​保しながら、独自の LoRA 生画像モデルを効率的にオフラインでトレーニングできます。

大規模モデルに関しては、Dimensity 9400 は、テキスト長が 32K のモデル ウィンドウを実行できます。これは、Dimensity 9300 の 8 倍です。

また、クライアント側でのマルチモーダルな大規模モデルの実行をサポートし、1秒あたり50トークンという超高速で従来の最先端技術を上回ります。

総合的な AI パフォーマンスに関しては、Dimensity 9400 がチューリッヒ ETHZ モバイル SoC ランキングで 6773 というスコアを獲得し、Dimensity 9300 の 1.4 倍のスコアでトップになりました

全体的に、Dimensity 9400 は TSMC の第 2 世代 3nm プロセスを採用しており、前世代と比較してシングルコア パフォーマンスが 35%、マルチコア パフォーマンスが 28% 向上し、同じパフォーマンスで消費電力が 40% 削減されています。

さらに、MediaTekは今回、エッジAI機能をモデル実行に適用しただけでなく、Dimensity Agentic AIエンジンも統合しました。これにより、ユーザーのニーズに基づいたクロスアプリケーション操作が可能になり、様々な習慣を記憶することで、スマートフォンは長く使うほどよりスマートになり、使い心地も向上します。

Dimensity 9400:使えば使うほど賢くなるAIスマートフォン

MediaTek が Dimensity 9400 を通じて提供する一連の新しいエッジ AI 機能を見てみましょう。

まず、MediaTekはXiaohongshuと提携して、デバイス上のSDXL RAW画像機能を開始しました。

さまざまなスタイルに対応できるだけでなく、全体的な速度がクラウド生成の2倍速いのがポイントです。

さらに、MediaTek は、Diffusion モデルをデバイス側に導入し、ビデオ生成モデルもデバイス側に導入するという大きな一歩を踏み出しました。

この技術も業界初であり、静止画から動画への大きな飛躍を実現しています。

実際に使ってみると、動画は1分半もかからずに生成されます。クラウドにアップロードするとしたら…おそらく順番待ちすらできないでしょう。

[動画は公式WeChatアカウントからご覧ください]

対照的に、エッジコンピューティングのパワーはクラウドコンピューティングほど優れてはいませんが、個々のユーザー専用であり、膨大な数のユーザーと競合する必要がないという利点があります。

もう 1 つの利点は、すべてのデータがローカルに保存および処理されるため、プライバシーとセキュリティがより適切に保護されることです。

そういえば、Dimensity 9400 で初めて導入されたデバイス側の LoRA トレーニング機能を紹介しなければなりません。写真があれば、独自のローカル LoRA モデルをトレーニングできるのです。

トレーニング済みのモデルを使用すると、あらゆるポーズや背景の個人的なポートレートを生成できるため、家を出ることなく世界中で写真を撮ることができます。

[動画は公式WeChatアカウントからご覧ください]

また、ArcSoft と共同で開発されたAI 搭載の画像編集機能もあり、デバイスで学習したユーザーの顔情報を使用して、ぼやけた写真をインテリジェントに修復します。

従来のインテリジェントな超解像度やその他の処理方法と比較して、より鮮明なだけでなく、顔の詳細も保持されるため、より自然に見える写真が得られます。

Dimensity 9400 は、一連の主要機能のデビューに加えて、エッジ マルチモーダル モデルのコンピューティング速度が 1 秒あたり 50 トークンに達するなど、いくつかの業界記録も更新しました。

Facewall Intelligence が開発したミニキャノン モデルは、2 つの線形方程式のシステムを素早く識別して解くことができます。

また、画像内のテキストの対応関係を理解し​​たり、外国語のメニューを素早く読み取ったり、料理を推奨したり、価格を直接計算したりすることもできます。

[動画は公式WeChatアカウントからご覧ください]

もちろん、全体的な AI パフォーマンスも精査に耐え、権威あるチューリッヒ ETHZ AI ベンチマーク 6.0 リストで合計スコア 6773 で 1 位にランクされています

このリストには、int8、int16、fp16 など、さまざまなタイプの 34 のモデルが含まれており、速度や精度などの複数の指標が含まれており、AI 機能の包括的な評価を提供します。

互換性と適応性の面でも、MediaTek は国内外の主要モデルメーカー 9 社と提携し、さまざまな主流の大型モデルをサポートしています。

MediaTekは、強力なエッジAIコンピューティング機能により、モバイル端末をよりスマートにする「インテリジェントAIフォン」という新しいコンセプトを提案しました。

Dimensity 9400 に組み込まれた Dimensity Agentic AI エンジンは、AI モデルとアプリケーションをインテリジェント エージェントに変換し、携帯電話を強力な「サポート アーミー」に変えることができます。

テイクアウトの注文を例に挙げると、通常の AI アシスタントはせいぜいテイクアウト アプリを開くのを手伝う程度ですが、インテリジェント化すれば、音声通信を通じて食べ物の選択から支払いの完了までの全プロセスを完了できるようになります。

ビデオをご覧ください:

[動画は公式WeChatアカウントからご覧ください]

Tongyi Qianwen の大規模モデル駆動型インテリジェント エージェントに基づいて、複数のインテリジェント エージェント アプリケーションをサポートするようになりました。

さらに、使用すればするほど AI はユーザーの習慣や好みを記憶し、より賢くなり、理解力が増し、使いやすくなります。

たとえば、ユーザーの好みに基づいて映画を推薦し、以前のチケット購入習慣に基づいて、あまり説明せずに好みの座席を選ぶことができます。

もちろん、このような成果を達成するには、MediaTek自身が提供するコンピューティングパワーに加えて、エコシステムのサポートも不可欠です。チップから端末、モデルからアプリケーションまで、あらゆる努力が不可欠です。

この目的のために、MediaTekはvivo、OPPOなどのメーカーと協力して、AIインテリジェントエージェントエンジンパイオニアプログラムを立ち上げ、インテリジェントエージェントアプリケーションのエコシステムをより完全で豊かにしました。

一方、MediaTek は開発者と積極的に協力し、AI エージェント、サードパーティ アプリケーション、大規模モデル間の統一された標準インターフェースを提供し、アプリケーション間の AI 接続を可能にしています。

これにより、AI 製品の開発サイクルが短縮されるだけでなく、より豊富なアプリケーションと優れたユーザー エクスペリエンスを備えた AI エコシステムの構築が加速されます。

専用のコンピューティング能力、プライバシー保護、ネットワークなしでの操作に対する需要が高まるにつれて、エッジ AI の開発は徐々に新たなコンセンサスになってきました。

中でもAIスマートフォンは、PC製品よりもデバイス数が多く、利用時間も長い、エッジAIの究極の担い手です。

モバイルAI技術の観点から見ると、MediaTekは紛れもなくリーダーです。本日発表されたDimensity 9400は、先進的なAI技術とエコシステムの力を借りて、モバイルフォンのインテリジェント化を加速し、人々の生活をより豊かに、より向上させるでしょう。

その背後には、強力なテクノロジーによる紛れもないサポートがあります。

ソフトウェアとハ​​ードウェア技術の相乗効果

技術的には、MediaTek はソフトウェアとハ​​ードウェアの両方の研究開発を同時に実施しており、両者が連携してエッジ AI の新たな飛躍を実現しています。

例えば、エッジベースのAIモデルでは、メモリ使用量の多さが大きなボトルネックとなっています。MediaTekはこの問題に対処するため、低ビット幅のキーバリューキャッシュ技術とGroup Query Attention(GQA)を組み合わせることで、メモリ要件を50%削減しました。

さらに、Dimensity 9400は、MediaTekの第8世代AIプロセッサ(NPU 890)を搭載するだけでなく、すべてのモデル計算をNPUにオフロードし、AIコンピューティングの特性に適したNPUを使用して計算を高速化します。具体的には、以下の一連の対策が講じられています。

  • エキスパート ルーティングなどのすべてのモジュールを NPU に転送することにより、エッジ側ハイブリッド エキスパート (MoE) モデルの純粋な NPU 計算が実現されます。
  • DiT (Sora のような) モデルの場合、4D および 5D テンソル用の NPU ハードウェアの独自の時間領域ニューロン ハードウェア命令を利用することで加速が実現されます。
  • エッジ側の LoRA トレーニングでは、これまで C/GPU で使用されていた命令を NPU でサポートされている加速命令に統合する新しいバックプロパゲーション オペレータ命令セットが採用されました...

最先端技術を推進するMediaTek。

まとめると、MediaTek の新しいテクノロジーと製品は、具体的に何をもたらすのでしょうか?

この質問には複数の観点から答えることができます。

まず、エンドユーザーにとっては、AI をよりアクセスしやすく手頃な価格にすることを意味します

AI 機能のモバイル デバイスへの統合が進むにつれて、モバイル ユーザーは膨大な数のクラウド サービスに圧倒されることがなくなり、さまざまな AI アプリケーションをローカルで直接体験できるようになります。

一方、MediaTek Dimensity 9400 が主導するインテリジェント統合アプリケーションの拡大により、AI アプリケーションの利用は下位層市場にもさらに浸透するでしょう。

これにより、スマートフォン利用の参入障壁がさらに下がり、高齢者などさまざまな理由で携帯電話を操作できない人々が、電子情報化時代に「取り残される」ことを回避できるようになります。

第二に、成長著しい大規模モデルに引き続き強い推進力を注入していくことが必要である。

大規模モデルには巨額の先行投資が必要であり、開発者がコストを回収するには大規模なユーザーベースが不可欠な要素となります。

MediaTek の端末市場シェアの優位性とモデルの使いやすさが相まって、大規模モデルにさらに多くの応用シナリオがもたらされたことは間違いありません。

もちろん、端末メーカーや MediaTek 自身にとっても、新機能はエッジ AI に関するユーザーフィードバックを得るための重要な手段です。

ますます多くの AI コンセプトが製品化され、実装されるにつれて、AI 製品に対するユーザーの期待とその欠点の理解はより具体的になり、改善のためのより的を絞ったフィードバックを提供できるようになります。

まとめると、これらの取り組みにより、より完全で大規模なエッジベースの生成 AI エコシステムが接続され、チップメーカー、端末メーカー、アプリケーション開発者、およびユーザーがその恩恵を受け、相互促進を通じて業界の共通の繁栄を実現できるようになると期待されます。

昨年、MediaTek 初のエッジサイド生成 AI チップである Dimensity 9300 が正式にリリースされ、特にモバイル フォン上のエッジ AI がより幅広いユーザーにとって利用しやすくなりました。

6か月後、Dimensity 9300のアップグレード版である9300+が発表され、エッジAIの戦場はさらに盛り上がり、モデル側とアプリケーション側の実践者がますます多く端末市場に注目し始めました。

Dimensity 開発者会議において、MediaTek は開発者やパートナーと連携し、チップ、モデル、アプリケーションのレベルでエッジ テクノロジのルートを模索し、エッジ エコシステム インフラストラクチャをさらに構築しました。

現在、Dimensity 9400 は新たなキングレベルの 5G インテリジェント AI チップとなり、エッジ インテリジェンスを基本的な大規模モデルの埋め込みからインテリジェント エージェントの新たな高みへと導き、 「インテリジェンス」と「知恵」の間に新たな分水嶺を描きました

PS: Dimensity 9400 チップを搭載した最初の一連のスマートフォンがまもなく発売される予定で、ユーザーはこれらのデバイスを通じて、Dimensity 9400 のより強力なオンデバイス AI 機能を体験できます。

AI 端末、端末 AI、AI がすぐに利用可能になり、どこにでも存在するようになります