618ZXW

「なぜ最も強力なオープンソース CPU は中国製なのか?」シリコンバレーの著名なインフルエンサーがこの考えさせられる質問を投げかけ、50 万人のオンライン視聴者の注目を集めました。

最高のパフォーマンスを誇るオープンソース CPU が中国製なのはなぜでしょうか?

過去2日間、海外の有力なブロガーが提起したある質問が、国際的なテクノロジーコミュニティで幅広い議論を巻き起こしました。

このメッセージは2日以内に50万回以上の閲覧と5,000件以上の「いいね!」を獲得しました。

これについては、Hackernews でも関連する議論が巻き起こりました。

「Xiangshan」プロセッサは、2日以内にGitHubスター数が急増しました。

問題のCPUは、中国科学院計算技術研究所の中核的成果である国産CPU 「Xiangshan」に他なりません。

CPU 自体は多くの議論と論争の対象となっており、その背後にあるプロジェクト「One Chip for Life」も同様です。

外国人は驚嘆した。中国人は中核プロジェクトを一歩一歩着実に構築している。

これは当然のことながら認識から生まれたものであり、このプロジェクトの中核責任者であり、中国科学院計算技術研究所の研究員であるバオ・ユンガン教授も次のように感想を述べている。

これは象山プロジェクトの肯定です。

最も強力なオープンソースプロセッサ

つまり、「Fragrant Hills」プロジェクトの人気の急上昇は、ある意味予想外のものだった。

このツイートを投稿したのは、オープンソースの自動運転企業Comma AIの社長であるジョージ・ホッツ氏です。ホッツ氏はチップハードウェア分野を定期的にフォローしており、最近、AMDのCUDA代替ソリューションのバグを指摘しました。

彼がツイッターで言及した「最強のオープンソース」は、2024年のRISC-Vヨーロッパサミットにまで遡ることができ、そこではXiangshanの最新バージョンである「Kunming Lake」がSPECint 2006テストで3GHzの周波数で正規化スコア45を達成しました。

そのパフォーマンスは ARM Neoverse N2 に匹敵し、現在までに知られている中で最も強力なオープンソース プロセッサとなっています

△XiangShan: 高性能プロセッサとアジャイルインフラストラクチャでオープンソースRISC-Vイノベーションを強化

詳細な比較については、以下の画像を参照してください。

高度な x86 コアと ARM コアの SPECint2006 スコアを見つけるのは難しいと指摘する人もいますが、どちらも PECint2017 を使用しており、最終的なクロック周波数が大きな影響を与えるためです。ただし、「Kunming Lake」は 3GHz で動作するため、パフォーマンスが非常に良好です。

この事件が激しい議論を巻き起こした後、中国科学院計算技術研究所の研究員である鮑雲剛氏も知乎で反応した。

鮑雲剛氏は、XiangshanオープンソースCPUプロジェクトは5年間進行中であり、業界の発展に伴い、オープンソースCPUへの信頼はさらに強くなったと述べた。

現在、象山プロジェクトはある程度の進展を遂げています。

その性能はARM Neoverse N2に匹敵し、産業用アプリケーションでも大手企業8社の顧客を獲得しています。

元の回答は次のとおりです: (すべてのコンテンツを表示するには上下にスクロールしてください):

この最新の対応により、象山プロジェクトの開発軌道がより明確になりました。

象山プロジェクトは2019年に遡ります。

Bao Yungang 氏と彼のチームの Tang Dan 博士は、Linux のようなオープンソースの RISC-V コア バックボーンを確立して、産業界で広く使用でき、学術コミュニティで革新的なアイデアの実験をサポートできることを常に信じてきました。

中国科学院の支援を受けて、中国科学院コンピューティング技術研究所は「Xiangshan」高性能オープンソースRISC-Vプロセッサプロジェクトを開始しました。

1年以上の準備期間を経て、チームは2020年6月にXiangshanプロセッサの開発を正式に開始し、GitHubコードリポジトリも開設しました。その後、深圳彭城研究所で主要な物理設計プロセスが完了しました。

報道によると、パイプラインのフロントエンド、バックエンド、メモリアクセスパイプライン、L1キャッシュ、L2/L3キャッシュなどの主要コードはすべて、Xiangshanチームによって独自に実装されたとのことです。

それから1年以上経った2021年7月、Xiangshanプロセッサ(Yanqi Lakeアーキテクチャ)の最初のバージョンが生産開始されました。

Yanqi Lake アーキテクチャはシングルコア シナリオ向けに設計されており、RV64GC 命令セットをサポートし、28nm プロセス ノードで 1.3GHz の周波数を実現します。

2022年1月、Yanqi Lakeのチップが返却され、正常に電源が入り、Linux/Debianなどの複雑なオペレーティングシステムを正しく実行できるようになりました。

2021年12月、XiangshanのR&Dチームはさらに拡大し、16の機関と協力し、北京オープンソースチップ研究所を設立して、Xiangshanプロセッサコアの製品化とそれに続くアーキテクチャ開発を実施しました。

第 1 世代チップが生産開始される 2 か月前に、第 2 世代の Xiangshan チップ ( Nanhu)の設計作業がすでに開始されていました。

Nanhu V1バージョンはデュアルコアシナリオ向けに設計されており、RV64GCBK命令セットをサポートし、2023年11月に生産開始されました。14nmプロセスノードで2GHzの周波数を実現します。

Nanhu V2バージョンには、MBISTなどの改良が含まれています。2023年4月にチップが組み込まれ、同年10月に返却され、Linuxの起動に成功しました。

Southlake V3 バージョンには、さらなる微細構造と PPA の改善が含まれ、プロジェクトは現在進行中です。

2022年8月24日、中国科学院コンピューティング技術研究所、北京オープンソースチップ研究所、テンセント、アリババ、ZTEなどの企業が共同研究開発チームを設立し、第3世代のXiangshan(昆明湖アーキテクチャ)の共同開発を正式に開始しました。

△画像出典:「象山オープンソースプロセッサ」WeChat公式アカウント

こうして、昆明湖の設計探索と南湖の製品化は、今後の象山プロジェクトの2つの主要課題として確立されました。

昨年8月に開催された第4回RISC-V中国サミットでは、Nanhuをベースにした開発ボードが正式に発表され、Genshin Impactが動作しました。

△画像出典:「象山オープンソースプロセッサ」WeChat公式アカウント

チームの隔週報告によると、昆明湖の研究開発は2023年11月に完了に近づいている。この記述は昨年4月の隔週報告に最後に掲載された。

その後の2週間ごとのレポートでは、昆明湖チームがエリア、タイミング、電力消費の最適化を継続していることが示されました。

しかし、Xiangshanプロセッサはまだ量産化に至っていない。

公式声明によると、Xiangshanは約6ヶ月間のマイクロストラクチャ反復サイクルとテープアウトサイクルを維持するとのことです。マイクロストラクチャに加え、高性能プロセッサ向けのアジャイル開発プロセスを模索・確立したいと考えています。

公式文書には象山の微細構造が詳細に記されています。

技術的な観点から見ると、Xiangshan プロセッサは Chisel ハードウェア記述言語を使用し、そのマイクロアーキテクチャはアウトオブオーダーの 6 発行構造と独立したメモリ アクセス サブシステム設計を採用しています。

R&D チームは、2 つのロード パイプライン、2 つのストア アドレス パイプライン、2 つのストア データ パイプライン、および独立したロード キュー、ストア キュー、ストア バッファなどを含むメモリ アクセス サブシステムを分離しました。

Southlake マイクロアーキテクチャの技術ドキュメントが完全に公開され、その全体的な構造は次のとおりです。

具体的には、Xiangshan プロセッサのフロントエンド パイプラインには、分岐予測ユニット、命令フェッチ ユニット、命令バッファなどのユニットが含まれており、これらが命令を順番にフェッチします。

Southlakeアーキテクチャは、分岐予測と命令キャッシュを分離したフェッチアーキテクチャを採用しています。分岐予測ユニットはフェッチ要求を発行し、キューに書き込みます。キューはフェッチ要求をフェッチユニットに送り、命令キャッシュに格納します。

取得された命令コードは、プリデコードによって予備的な分岐予測エラーチェックを受け、予測パイプラインを適時にフラッシュします。チェックされた命令は命令バッファに送られ、デコードモジュールに渡され、最終的にバックエンドへの命令供給となります。

バックエンドには、デコード、名前変更、バッファの並べ替え、予約ステーション、整数/浮動小数点レジスタ ファイル、および整数/浮動小数点演算ユニットが含まれます。

プロセッサのパイプラインのバックエンドは、命令の名前変更と順序外実行を担当します。

下の図に示すように、Xiangshan プロセッサ (Nanhu) のバックエンドは、CtrlBlock、IntBlock、FloatBlock、Memblock の 4 つの部分に分けられます。

CtrlBlock は命令のデコード、名前変更、ディスパッチを担当し、IntBlock、FloatBlock、MemBlock はそれぞれ整数、浮動小数点、メモリ アクセス命令の順序外実行を担当します。

(VectorBlockworlds は、ベクター処理を処理するために、第 3 世代の Xiangshan プロセッサ (Kunming Lake) のバックエンドに追加されました。)

Xiangshan プロセッサの MemBlock には、コア内のメモリ アクセス パイプラインとキュー、およびメモリ アクセス パイプラインに緊密に結合されたレベル 1 データ キャッシュが含まれています。

2つのロードパイプライン、2つの独立したstdパイプライン、そして2つのstdパイプラインが含まれています。ロードパイプラインとストアパイプラインは、メモリアクセス命令の順序情報を維持する役割を担っています。

最新の Kunming Lake アーキテクチャにはまだ詳細な技術ドキュメントはありませんが、チームは全体的なアーキテクチャ図を公開しています。

全体的な構造はNanhuと類似しているように見えますが、バックエンドの各ブロックの具体的な実装にも多くの変更が加えられています。ベクトル処理用のブロックが追加され、一部部品のキャッシュ容量も向上しています。

オープンソース ライセンスに関しては、Xiangshan は Magnolia Permissive License バージョン 2 を採用し、すべての設計ソースコードとプロセスを公開することを主張し、コミュニティからの貢献を歓迎しています。

ネットユーザー:中国は中核的なエンジニアリング能力を一歩ずつ構築している。

「香る丘」プロジェクトへの予想外の関心の再燃は、海外のネットユーザーの間に不安も引き起こしている。

コメントでは、これはまさに中国が基本的なハードウェアの問題を解決していることを意味すると確信を持って述べた人もいました。

シリコンバレーが依然としてハードウェア系スタートアップ企業に資金を提供する一方で、中国はコアとなるエンジニアリング能力を着実に構築している。
...
挑戦的な課題こそが、真に才能のある人材を引き付ける鍵です。

米国で最も優秀なチップ設計者はNvidiaとAppleにいて、オープンソースに取り組んでいる人は誰もいない、という人もいます。

論理と数学が中国の強みであるならば、それがコンピューターの将来にどのような影響を与えるのかと疑問を呈する人さえいる。

「One Chip for Life」計画を暴露した人もいます。

ここで言及されているのは、実際には中国科学院大学が2019年に開始したプログラムです。

簡単に言えば、目標は、学部生が主導して 64 ビット RISC-V プロセッサ SoC チップの設計とテープアウトを行い、学生自身が作成した Linux オペレーティング システムと UCAS-Core 教育用オペレーティング システムを正常に実行できるようにすることです。

このプログラムに参加した最初のグループはわずか 5 人でしたが、数年にわたって徐々に規模が拡大し、6,000 人以上が参加するようになりました。

この計画の中心的な目的は、「オープンソースと共有」というコンセプトに基づいて、従来のコースの境界を打ち破り、人材の育成から科学研究や産業への展開までのサイクルを短縮することです。

同様のモデルは、前世紀にMITで人気を博したミード・コンウェイ研修プログラムにも見られます。このプログラムも、学生がチップの設計から製造までを最初から最後まで行えるようにすることに重点を置いていました。その後、多くの学生がこのコースの設計図を受講し、シリコンバレーで起業しました。

つまり、2025年の初めには、国内のオープンソースが頻繁に話題になり始めたのです。

「Fragrant Hills」について議論しているとき、ある人は次のように述べました。

DeepSeek も忘れないでください。

中国ではオープンソースの取り組みがますます増えているようです。

参考リンク:
[1]https://x.com/realGeorgeHotz/…
[2]https://news.ycombinator.com/…
[3]https://riscv-europe.org/summ...\_poster.pdf
[4]https://docs.xiangshan.cc/zh-...