618ZXW

黄(ホアン)氏が5090を発表。価格は1万5000元!世界最小のAIスーパーコンピュータも登場。価格は2万2000元。

ちょうど今、 Lao Huang は、真新しいレザージャケットを着て、 CESで一連の驚くべき動きを披露しました。

まず、最新の GPU であるRTX 5090をリリースしました。

Blackwell アーキテクチャに基づく最新の GPU の主なパフォーマンス特性を見てみましょう。

  • 920億個のトランジスタを搭載
  • 4000 AI TOPS(1秒あたり兆回の演算)のパフォーマンスを備えています。
  • 380 RT TFLOPS(1秒あたり兆浮動小数点演算)のレイトレーシング性能を実現できます。
  • 1.8 TB/s のメモリ帯域幅により、データの読み取りと書き込みを高速に行うことができます。
  • 125 TFLOPSのシェーダパフォーマンス

この50シリーズGPUの価格も同時に発表されました。

  • RTX 5090:1999ドル(約14651元)
  • RTX 5080:999ドル(約7321元)
  • RTX 5070 Ti: 749ドル(約5489元)
  • RTX 5070:549ドル(約4023元)

Blackwell アーキテクチャでは、相互接続テクノロジの新しい波であるNVLink72も登場しました。

主なパフォーマンスのハイライトを簡単に見てみましょう。

  • 72 個の Blackwell GPU が 1.4 ExaFLOPS TE FP4 コンピューティング能力を提供します。
  • トランジスタの数は130兆個に達した
  • 2592個のGrace CPUコアを搭載
  • 72枚のConnectX-8ネットワークインターフェースカード
  • 576個のメモリチップ、総容量14TB、帯域幅1.2PB/s
  • 18 台の NVLink スイッチ、合計接続帯域幅 130 TB/秒

興味深いことに、Lao Huang は現場で盾のような巨大なサンプルを手に持ち、悪ふざけを始めた。

さらに、AI スーパーコンピューティングは PC の時代に入りました。

ちょうど今、一道氏は世界最小の個人用 AI スーパーコンピューター「 Project Digits」もリリースしました。

どれくらい強力ですか?

2000 億のパラメータを持つ大規模なモデルを、自分のデスク (自分のデスクトップ システム) 上で直接実行できます。

両方の Project Digits を併用すると、 4,050 億のパラメータを持つ大規模なモデルを実行できます。

各 Project DIGITS には、128 GB の統合コヒーレント メモリと最大 4 TB の NVMe ストレージが搭載されており、標準の電源コンセントだけで動作できます。

さらに、デスクトップ システムで大規模なモデルを開発または推論した後、高速化されたクラウドまたはデータ センター インフラストラクチャにシームレスに展開できます。

老黄はその場でこう言った。

AIはあらゆる業界、あらゆるアプリケーションで主流になるでしょう。

Project DIGITS のようなパーソナル AI スーパーコンピューターは、あらゆるデータ サイエンティスト、AI 研究者、学生の机の上に置くことができ、人工知能の時代に参加し、その形を作ることが可能になります。

Project DIGITS の発売もそう遠くない。今年の 5 月から発売され、価格は3,000 ドル(約 21,978 元) からとなる。

では、Project DIGITS はどのようにして小型かつ強力になったのでしょうか?

最新のGB10スーパーチップを搭載

Project DIGITS の鍵となるのは、新しいGrace Blackwell スーパー チップ (GB10)です。

このチップシリーズはおそらく皆さんご存知でしょう。Grace Blackwellアーキテクチャをベースにしたシステムオンチップ(SoC)です。

FP4 精度で最大1 京回の浮動小数点演算の AI パフォーマンスを提供できます。

GB10 には、NVLink-C2C チップ間相互接続を介して高性能 NVIDIA Grace CPU (Arm アーキテクチャに基づく 20 個のエネルギー効率の高いコアを搭載) に接続された NVIDIA Blackwell GPU (最新世代の CUDA コアと第 5 世代 Tensor コアを搭載) が含まれています。

MediaTekはGB10の設計に参加し、エネルギー効率、性能、接続性の向上に役立ったとされている。

このアーキテクチャに基づいて、企業や研究者は、ローカル Linux システムで実行される Project DIGITS でモデルのプロトタイピング、微調整、テストを実行し、それを NVIDIA DGX Cloud やその他のプラットフォームに展開できます。

ユーザーは、NGCカタログと開発者ポータルに掲載されているソフトウェア開発キット、オーケストレーションツール、フレームワーク、モデルなどを含む大規模なAIソフトウェアライブラリにもアクセスできます。NVIDIA NeMoフレームワークを使用してモデルを微調整したり、NVIDIA RAPIDSライブラリを使用してデータサイエンスを加速したり、PyTorchなどの一般的なフレームワークを実行したりできます。

また、NVIDIA Blueprints と NVIDIA NIM マイクロサービスを使用してインテリジェント AI アプリケーションを構築することも可能になります。NVIDIA AI Enterprise ライセンスは、実験環境から実稼働環境まで、エンタープライズ グレードのセキュリティとその他のサポートを提供するものと理解されています。

商用利用を可能にする世界ベースのモデル「Cosmos」

同時に、黄氏は、NVIDIA が商業的に実現可能な世界基盤モデルであるCosmos をオープンソース化するとも発表した。

Cosmos プラットフォームには、物理​​世界の合成データを生成するための拡散および自己回帰 Transformer モデルと、ビデオ処理を高速化するためのビデオ トークナイザーおよびパイプラインが含まれています。

Cosmos ベースモデルは、2,000 万時間の運転およびロボット工学ビデオ データでトレーニングされており、主に自動運転と次世代ロボット工学トレーニングの研究開発を加速するために使用されます。

開発者は、Cosmos を使用して物理的に合成されたデータを生成するか、独自のビデオ データを備えた NVIDIA NeMo フレームワークを使用して微調整を行うことができます。

今回のリリースも、AI 技術開発の現在の動向に基づいています。

具体的には、今年の CES で Huang は次の 3 種類のモデルを発表しました。

  • Nano: エッジ展開向けに最適化された、超低レイテンシのリアルタイム モデル。
  • Super: すぐに使用できる微調整と展開に適した高性能のベースライン モデル。
  • Ultra: 最高の精度と品質、モデルのカスタマイズに適しています。

報道によれば、これらのモデルのパラメータは約40億から140億の範囲にあり、規模に関係なくあらゆる企業がCosmosモデルを自由に利用できるという。

これまでに発表された最初のトライアルユーザーには、ロボット企業の1XやAgility Roboticsのほか、Uber、XPeng、BYDなどの自動運転企業が含まれている。

ちなみに、黄氏(トヨタ創業者)は、トヨタがNVIDIAのチップとオペレーティングシステムをベースに次世代の新エネルギー車を開発することを具体的に発表しました。

使用デモンストレーションに基づき、Cosmos はすでに産業や自動運転における大量のデータ生成を支援し、関連する AI 技術の研究開発を加速させています。

本日より、開発者は NVIDIA API カタログで最初の一連の Cosmos モデルをプレビューし、NGC カタログと Hugging Face からモデルと微調整フレームワークをダウンロードできます。

さらに、Cosmos は、Omniverse (NVIDIA の産業デジタル化および物理 AI シミュレーション プラットフォーム) をさらに拡張するための新たな可能性も提供します。

開発者は、Omniverse で 3D シーンを構築し、レンダリングして、それを使用して Cosmos モデルの合成仮想環境を生成し、それを物理的な人工知能のトレーニングに使用することができます。

もう一つの見事なシーンは、ロボットの列の真ん中に立つ老黄で、まさに具現化知能ブームの時代を彷彿とさせます。

2つの新しいモデルサービスも利用可能です。

非常に流行している世界的モデルに加えて、老黄は今回、2つの主要な分野でモデルサービスもリリースしました。

1つはAI基本モデルで、主にRTX AI PCに適用され、簡単で柔軟な開発に重点を置いています。

具体的には、ユーザーは、グラフィカル ユーザー インターフェイス (GUI) にリンクされたNIM マイクロサービスに接続することで、最新の生成 AI モデルに簡単にアクセスして展開できます。

NVIDIAは、Black Forest LabsやMetaといったトップモデル開発会社から、様々なタイプを網羅したNIMマイクロサービスシリーズをリリースしています。例えば、Llama NemotronシリーズのNanoモデルは、RTX AI PCやワークステーション向けのマイクロサービスとして利用でき、エージェントAIタスクに最適です。

これらのマイクロサービスには、PC上でAIを実行するための主要コンポーネントが含まれており、NVIDIA GPU向けに最適化されています。Windows 11 PC(WSL搭載)に簡単にダウンロード、セットアップ、実行でき、幅広いAI開発およびエージェントフレームワークと互換性があります。

NIM マイクロサービスに加えて、 AI ブループリントもまもなく PC で利用できるようになります。

AI ブループリントは NIM マイクロサービス上に構築されており、主にデジタル ヒューマン、コンテンツ作成、その他のアプリケーション向けに事前構成されたリファレンス ワークフローを提供します。

たとえば、PDF からポッドキャストへのブループリントでは PDF コンテンツを抽出してスクリプトとオーディオを生成できます。また、3D ガイド付き生成 AI ブループリントではアーティストが 3D シーンを使用して画像生成をより適切に制御できます。

具体的には、NVIDIA は、NVIDIA RTX Neural Faces アルゴリズムを使用して顔をレンダリングし、新しい Audio2Face – 3D モデルによってアニメーション化され、さまざまな AI サービスやマイクロサービスに接続できる視覚対応の PCアバターであ​​る Project R2X をプレビューしました。

NIMマイクロサービスとAIブループリントは今年2月から利用可能となっており、複数のPCメーカーやシステムビルダーがNIMに対応したRTX AI PCを発売する予定だ。

NVIDIA はまた、NIM マイクロサービスに基づいて、次のようなNemotron モデルファミリをリリースしました。

  • ラマ・ネモトロン大規模言語モデル
  • Cosmos Nemotron 視覚言語モデル

これら 2 つの主要モデルは、 AI インテリジェント エージェントの方向に傾いています。

Llama Nemotron はオープンソースの Llama ベース モデル上に構築されており、最新の NVIDIA テクノロジーと高品質のデータセットを使用してプルーニングとトレーニングを行い、計算効率と精度を最適化します。

命令の追跡、チャット、関数呼び出し、コーディング、数学に優れており、最適化されたサイズにより、さまざまな NVIDIA アクセラレーション コンピューティング リソースで実行できます。

サイズに関しては、ナノ、スーパー、ウルトラの 3 つのサイズがあります。

  • Nano はコスト効率に優れ、低遅延のリアルタイム アプリケーションや PC、エッジ デバイスに適しています。
  • Super は単一の GPU で高いスループットと高精度を実現します。
  • Ultra はデータ センター規模のアプリケーション向けに設計されており、最高の精度を提供します。

Cosmos Nemotron ビジュアル言語モデルは、NVIDIA の NIM マイクロサービスと統合されており、開発者は複数の分野に適用可能な画像やビデオを分析して応答できるインテリジェント エージェントを構築できます。

もう一つ

Nvidia CEO の Jensen Huang 氏が CES のステージに上がる直前に、Nvidia の株価が史上最高値を更新しました。

株価は3%以上上昇し、1株当たり149.43ドルで取引を終えた(昨年11月7日に記録した1株当たり148.88ドルの過去最高値を上回った)。また、最新の評価額は3兆6600億ドルに達し、アップルに次ぐ世界第2位の上場企業となった。

△画像出典:@YahooFinance

今回のリリースは皆様の期待に応えられたでしょうか?