618ZXW

中国電信の邵光禄氏:大規模AIモデル向けインテリジェントコンピューティングクラスタとネットワークの実践と展望

先日、深圳で高性能コンピューティングと人工知能(HACI)における協働イノベーションに関する国際フォーラムが開催されました。中国電信(チャイナテレコム)科学技術委員会主任の邵光禄氏が会議に招待され、インテリジェントコンピューティングクラスターとネットワークに関する同社の実践と考察を共有しました。

「コンピューティング能力は人工知能(AI)の発展にとって極めて重要な原動力であり、大規模モデルの反復と革新の速度、そして経済発展の速度にも影響を与えます」と邵光禄氏は説明した。インテリジェントコンピューティングに関して、チャイナテレコムは2つの主要な取り組みに注力している。1つ目は、大規模インテリジェントコンピューティングクラスターの構築で、上海と北京で既に1万枚のカードを搭載した2つのクラスターが稼働している。2つ目は、大規模AIモデルのトレーニングのためのインテリジェントコンピューティングクラスターを、データセンター(IDC)からAIデータセンター(AIDC)へとアップグレードすることである。これは、モデルコンピューティングパワー利用率(MFU)、線形速度向上、安定性、レイテンシ、パケットロス率、GPU利用率という6つの主要指標に焦点を当て、インテリジェントコンピューティングクラスターの継続的な設計、構築、運用、最適化を伴い、大規模モデルのトレーニングの効率と効果を向上させることを目的としている。

第二に、インテリジェントコンピューティングネットワークとコンピューティングパワースケジューリングプラットフォームを活用し、コンピューティングリソースの全国的な相互接続と相互運用性を実現し、オンデマンドの割り当てを可能にしています。自社開発の「Xirang」コンピューティングパワースケジューリングプラットフォームは、既に全国で21EFlopsのコンピューティングパワースケジューリングを達成しています。チャイナテレコムは「クラウド、ネットワーク、インテリジェンス」技術の融合を積極的に推進し、「クラウド、エッジ、ターミナル」領域を横断する、柔軟で超ブロードバンド、高速、ロスレス、かつ完全ディスパッチ可能なインテリジェントコンピューティングパワーネットワークの構築に注力しています。これにより、大規模モデルのトレーニングと推論に対する、様々な企業や業界の多様なニーズに応えています。

邵光禄氏は、チャイナテレコムが通信事業者から通信+クラウドコンピューティング事業者へと進化したと述べた。AI時代において、チャイナテレコムはさらにインテリジェントコンピューティングサービスプロバイダーと大規模モデルサービスプロバイダーへと進化し、コンピューティングパワーサービスとモデルサービスを提供していく。

邵光露氏は、コンピューティングパワーのネットワーク化が発展方向となっていることを指摘し、以下の提案を行った。第一に、コンピューティングパワーエコシステムのオープンソース化と開放性を推進し、異機種コンピューティングパワーの相互運用性のための基本的な開発環境を提供し、統一標準を用いて様々な異機種ハードウェアを接続し、異機種コンピューティングパワー間の大規模モデルの自由な切り替えを促進する。第二に、共同構築と共有を促進する。生成型人工知能は、重要な技術革新と産業変革であり、早期の計画と迅速な推進が求められる。学術界と産業界が戦略的ビジョンを持って協力を強化し、基盤技術の突破に力を注ぎ、産業革新と産業エコシステムの構築を促進する必要がある。