|
DeepSeekは国内AI業界を総動員するほどの人気! 春節が終わる前に、すでに複数の国産チップに素早く適応され、主要なクラウドプラットフォームでリリースされており、非常に活気のある光景でした。 この一連の開発は、主に次の 3 つの側面に焦点を当てています。
実際、国産の大規模モデルのエコシステムと国産チップの計算能力を適応させることに成功した事例もあります。 コンピューティング能力のボトルネックを打破:国内AIエコシステムの生死を分けるブレークスルーDeepSeekの人気が中国のAI業界にこれほど迅速な行動を促したのはなぜでしょうか?それは、モデル自体の技術的な優位性だけによるものなのでしょうか? 答えはそうではありません。 もう一つの重要な要素は、国際的なコンピューティングパワーサプライチェーンの不確実性への対処です。国際的な圧力に直面し、大規模モデルに対する独立した管理を実現することがますます急務となっています。 コンピューティング能力は大規模モデルの基盤であり、アプリケーション シナリオに応じて、トレーニング コンピューティング能力、推論コンピューティング能力、アプリケーション コンピューティング能力に分けられます。 トレーニング用コンピューティングパワーとは、機械学習モデルのトレーニングに使用されるコンピューティングリソースを指します。このプロセスには、大量のデータ入力、複雑な数学演算、そして反復的な最適化の繰り返しが含まれます。これは計算負荷が高く、時間がかかり、高いハードウェア要件と大量のデータを必要とします。 推論コンピューティング能力とは、学習済みモデルを実世界のデータに適用し、予測や結果を生成するために使用される計算リソースです。このプロセスは学習よりも単純ですが、高い効率性と低レイテンシが求められます。 アプリケーション コンピューティング パワーとは、データ処理、モデル推論、ユーザー インタラクション、ストレージ、ネットワーク通信など、AI アプリケーション システム全体の動作をサポートするコンピューティング リソースを指します。 現在、中国の大規模モデル業界では、大規模モデルの計算能力、特にトレーニング段階は依然として主に海外の計算能力に依存しています。 では、なぜトレーニングフェーズがそれほど重要なのでしょうか?それは、AIモデルをゼロから構築するには、トレーニング用のコンピューティングパワーが不可欠だからです。大規模モデルの進歩は継続的な最適化と反復作業に依存しており、そのためには継続的な投資が必要です。 学習フェーズでは、モデルパラメータの最適化とモデル性能の向上に強力な計算能力が不可欠です。現在主流の大規模モデルは、数千億、あるいは数兆ものパラメータを持つことが多く、このような巨大なパラメータ空間は膨大な計算負荷を意味します。 このような複雑な学習タスクをサポートできるのは、大規模なコンピューティングクラスターだけです。さらに、より効率的な並列化戦略やよりインテリジェントなパラメータ探索手法といった学習アルゴリズムの革新により、計算能力への要求はさらに高まります。 コンピューティングパワーのトレーニングは、AI技術イノベーションの戦略的優位性です。その自律性と制御性の程度は、産業発展における主導権を直接左右します。大規模モデルのトレーニングプロセスを制御して初めて、AI技術イノベーションの核心を掌握したと言えるでしょう。 国内のコンピューティングパワープラットフォームがまだ開拓段階にあった頃、多くの企業は高い技術的障壁と大きな投資リスクのために躊躇していました。iFlytekは先駆者として「ハードコアなブレークスルー」の道を選びました。 iFlytekとHuaweiが共同開発した国産コンピューティングパワープラットフォーム「Feixing-1」は、2023年10月の発売以来安定的に稼働しており、年間平均利用率は94%で、数兆個のパラメータを持つ大規模モデルのトレーニングをサポートできます。 2024年1月、「飛星1号」の最初の成果は、国産の計算力で訓練された最初の大規模モデルである「迅飛星火V3.5」でした。 1年が経過したが、iFlytek Sparkは依然として、完全国産の大規模コンピューティングパワーモデルを持つ唯一の企業である。 なぜそれが唯一のものなのでしょうか? これは、完全に社内で開発されたテクノロジーが非常に複雑な段階にあり、チップの命令セットの最適化から超大規模クラスターの安定性の確保まで、複雑さが飛躍的に増大しているためです。 長期的な投資は、戦略的決意の試金石でもあります。コンピューティングパワーの完全なローカライズには、長年にわたる集中的な投資が必要です。多くの企業は、必然的に既製のソリューションを選択する傾向があります。このパス依存性により、トレーニングに必要なコンピューティングパワーは常に他者の影響を受けることになります。 特筆すべきは、今年 1 月 15 日に iFlytek が iFlytek Spark X1 をリリースしたことです。これは、DeepSeek と非常によく似た、国産のコンピューティング能力でトレーニングされた深い思考と推論機能を備えた中国初の大型モデルです。 iFlytekは、国産910Bコンピューティングカード1万枚のみを使用し、大規模モデルの開発において一連の成果を達成しただけでなく、国産コンピューティングプラットフォームの未開拓領域への適応と効率の最適化を数多く実現しました。少ない計算能力とより小さなモデルサイズで、国産コンピューティングプラットフォームにおいて業界をリードするディープシンキングと長文推論の効果を実現しました。 国内のコンピューティング能力は究極の効率に達しており、これは技術力と戦略的勇気の両方を必要とするものであり、複雑な認知タスクを処理する国内の AI 技術における大きな進歩を示すものであると言えます。 iFlytekの劉清鋒会長は、iFlytekチームが反復作業を加速しており、来月中にさらに性能が向上したiFlytek Spark X1のアップグレード版を発売する予定であり、数学、教育、医療、科学研究などの主要分野で常に業界をリードする地位を維持できることを明らかにした。 一方、iFlytek、Huawei、合肥ビッグデータ資産運営有限公司が共同で構築した国産の超大規模インテリジェントコンピューティングプラットフォーム「飛星2号」の最初のコンピューティングパワーは、2025年に試験使用のために納入される予定です。 この国内AIエコシステムの共同開発は、期待をはるかに超える「化学反応」を生み出した。ファーウェイのAscendシリーズチップは、現実世界のシナリオで厳密にテストされ、AIアプリケーションにより適した機能を開発するために絶えず改良と反復が続けられてきた。一方、iFlytekのモデルは、ハードウェアへの深い適応を通じて、コンピューティングパワーのボトルネックの制約から解放され、革新的なトレーニングパラダイムを模索してきた。 ますます多くの企業が参入するにつれ、中国のAI技術システムの独自性が明らかになり始めている。それは単なる海外技術の模倣でもなければ、密室で開発された全く新しいシステムでもなく、生態学的連携の中で進化し発展してきた新種なのである。 iFlytekの劉清鋒会長は、「ある世代が木を植えれば、次の世代も木陰で過ごせると言われています。大型モデルを完全国産化するには、誰かが木を植えなければなりません」と述べた。市場の熱狂の裏には、先駆者たちの先見性と決意が、景気循環を超えたこのAI競争において戦略的な意義を発揮している。 iFlytek は、トレーニング コンピューティング パワー、推論コンピューティング パワー、アプリケーション コンピューティング パワーの完全なローカライズを完了しました。 2024年1月以来、iFlytek Spark大型モデルは5回のアップグレードを経て、GPT-4 TurboおよびGPT-4oを継続的にベンチマークし、Spark多言語大型モデルもデビューさせ、世界に第2の選択肢を提供しました。 産業応用の面では、iFlytek は GBC の 3 つの方向すべてをカバーしている数少ない市場参加者の 1 つであり、 「GBC 連携」を通じて大型モデルの応用を推進しています。 GBC コラボレーションには、3 つの主要ビジネス領域にわたってリソースを展開するだけでなく、それらの領域内でのリソースの共有と相乗効果を活用することも含まれます。 Gエンドでの実証効果を確立することで、BエンドとCエンドの市場拡大の基盤が築かれます。Bエンドでは、業界の大手企業との協力により市場影響力が拡大し、Cエンド製品に対する市場認知度と信頼が向上します。同時に、Cエンドからのフィードバックと市場需要は、GエンドとBエンドの両方で製品最適化のためのデータサポートを提供します。 この戦略のもとで具体的にどのような成果が達成されましたか? モデルの反復に関して、2024年には、iFlytek SparkのGB上の共通機能が25%向上し、長いテキストのパフォーマンスは50%、業界のグラフィックパフォーマンスは60%向上しました。 事業実装面では、iFlytekは昨年末までに、中国石油天然気集団、中国移動、中国海洋石油総公司などの中央企業や国有企業、および20を超える業界の大手企業と連携し、300以上の応用シナリオを網羅した業界全体にわたるモデルをリリースした。 また、iFlytekは2024年の「中央・国有企業大規模モデル1位」を獲得し、落札額が2位から6位の合計額を上回り、落札件数と金額の両方で明確なリードを獲得したことも特筆に値する。 △画像出典:インテリジェントハイパーパラメータ モデルとコンピューティングパワーを構築し、業界データを蓄積し、アプリケーションとサービスに注力することで、「技術的優位性 - 商業的利益 - データフィードバック」の好循環を確立し、継続的に「堀」を深め、複雑な競争の中で足場を築くことができます。 コンピューティング能力の飛躍的進歩から始まったこの技術革命は、最終的には生態学的価値の完全な解放へと進化するだろう。これこそが、中国のAIが世界に提供できる最良の答えなのかもしれない。 「汎用人工知能は集中力を必要とするマラソンです。」さらに時を進めていくと、中国における大型モデルの開発は実は重要な節目に達していることがわかります。 一方で、大規模モデルはより高度な知能へと進化を遂げ、他方ではAI業界のエコシステムはより深化・強化されつつあります。基盤からモデル、そして応用に至るまで、すべてが汎用人工知能という究極の目標に向けて加速しています。 これは、国内外の専門家の見解によってさらに裏付けられています。AGI 実現のタイムラインについてはさまざまな意見があるものの、確かに重要な局面を迎えています。 アルトマン氏は、汎用人工知能(AGI)は既存のGPUハードウェアで実現できると考えています。彼の年末のまとめは、OpenAIがAGIの実現方法を明確に定義し、より遠い目標である超知能に照準を合わせていることを示しました。 李菲菲は空間知能の実現に注力しており、AGIの重要なステップとして、空間知能がAIの学習、理解、そして行動を可能にすると考えています。つい最近、彼女のチームはAIシミュレーション世界のプロトタイプを完成させました。AIはたった1枚の画像からインタラクティブな3D世界を生成できます。 チューリング賞受賞者のルカン氏とヒントン氏は、大規模モデル機能の急速な反復に伴うセキュリティ上の懸念に焦点を当て、人間の介入なしにローカルで人工知能を開発する方法を探求しました。これはAGIにとって避けられない課題です。 誰もがこれをいかに実現するか、そして実現までの道のりはどれほど遠いのかを議論している中、iFlytekの劉清鋒会長は独自の見解を示した。汎用型大型機の限界は依然として高くなっている。しかし、どれだけ発展しても、その基礎は自らの手で築かなければならない。他人の庭に自らの建物を建てることは決してあってはならないのだ。 汎用人工知能の現在の盛り上がりの中で、我々が国内で独立かつ制御可能な基盤を持つかどうかが、この道をどこまで進むことができるか、この汎用人工知能の波の恩恵を享受できるかどうか、そして米国に続くグローバルインテリジェンスの台頭の第二波になれるかどうかを決定すると劉青鋒氏は考えている。 この論理に基づいて、「Feixing-1」を作成する理由を見つけることができます。 iFlytek は遠くまで行っただけでなく、深くまで進出しました。 iFlytekは創業以来、ローカライゼーションの道を歩み続け、「技術を通じて国に貢献する」ことを目指し、「中国の音声技術が中国の最高水準で開発され、中国の音声産業が中国国民の手に委ねられる」ことを保証してきました。中国技術の開発に向けたこの当初の志は、深遠かつ永続的な影響を与えてきました。 周知の事実により、iFlytekは最初に抑圧され、幻想を捨て去った企業の一つとなりました。数々の困難な努力を経て、同社の中核技術研究・製品開発プラットフォームは徐々に完全な自立と制御を獲得し、今日の活気あるエコシステムを築くことができました。 iFlytekの選択は、iFlytekと大規模モデルに適用されるだけでなく、中国の人工知能業界全体にもインスピレーションを与える可能性があります。 まず、大規模モデルベースにおけるイノベーションは、独立したイノベーションの中核的な原動力です。現在、大規模モデルベースのイテレーションを減速させるという世界的な潮流が進行していますが、iFlytekのような企業は依然として大規模モデルベースを継続的に更新することができます。 ベースモデルの継続的な反復とアップグレードは、AI システム機能の起動を決定するだけでなく、さまざまな分野での AI 技術の実装と革新を促進します。 AI技術の継続的な発展に伴い、業界における分業は徐々に最適化され明確になり、「基礎層ではコンピューティングパワーを重視し、応用層ではシナリオイノベーションに重点を置く」という新たなパターンが形成されています。 基盤層の企業はコンピューティング能力とアルゴリズムの効率性の向上に注力でき、アプリケーション層の企業はこれらの基盤技術に基づいてより革新的なアプリケーション シナリオを開発できます。 さらに、そしてより重要なのは、安全マージンの向上が企業の自主的なイノベーションにとって極めて重要な保証となることです。今日の不安定な市場環境において、自立性と制御性は業界に「技術的冗長性」をもたらし、企業が外部環境の変動により冷静に対応することを可能にします。 例えば、チップ供給不足の時期には、独立したトレーニング能力を持つ企業は、アルゴリズムとモデルを最適化してハードウェアへの依存度を低減し、事業継続性を維持することができます。こうした技術的な冗長性は、企業のレジリエンス(回復力)を高めるだけでなく、業界全体のセキュリティ強化にもつながります。 最後に、国産コンピューティングパワープラットフォームの台頭により、より幅広い企業に利便性がもたらされました。 企業はもはや車輪の再発明をする必要がなくなり、国産プラットフォーム上で直接アプリケーションを開発できるようになります。これにより、技術的な障壁が低くなるだけでなく、AI技術の普及と応用が加速されます。 例えば、iFlytekは、様々な業界における大規模モデルの導入を支援するため、汎用性と専門性を兼ね備えたアプローチ、エッジクラウド連携、ハードウェアとソフトウェアの統合を組み合わせ、より多くの企業のデジタル変革を支援しています。これにより、「コンピューティングパワーの構築、データ管理、モデルのトレーニング」に加え、「シナリオの実装、セキュリティの確保、運用の改善」までを網羅した包括的なソリューションが実現しました。現在、iFlytek Sparkは、中央政府および国有企業にとって大規模モデル導入の第一選択肢となっています。 将来的には、AGI の実現は依然として困難ですが、大きな期待が寄せられています。 このプロセスにおいて、自主的なイノベーションが鍵となる。中国企業は、将来の競争において優位性を獲得するために、自主的かつ制御可能な技術ロードマップを堅持し、技術力を継続的に向上させなければならない。同時に、業界における分業体制はより明確になり、応用シナリオはより多様化することで、企業は様々な外部不確実性に容易に対応できるようになるだろう。 技術の継続的な進歩により、AGIはもはや手の届かないものではなく、私たち全員が目指す目標となっています。iFlytekの劉清鋒会長の言葉を借りれば、これは集中力を要する長距離レースとなるでしょう。 - 以上- QbitAI・Toutiao 署名 最先端技術に関する最新ニュースを入手するには、ぜひフォローしてください。 |
DeepSeekの可能性は無限大!先駆者たちはすでに完全国産化への道を切り開いています。
関連するおすすめ記事
-
オープンソースと学術評価の相乗効果に関する短い議論 | CCCFハイライト
-
2025 年グローバル機械学習テクノロジー カンファレンスが間もなく開催されます。世界中のトップ AI 専門家が集まり、将来のテクノロジーのトレンドについて議論します。
-
AAAI 2025に選出!中国の2大大学による共同提案「BSA Fusion」は、マルチモーダルな医用画像の位置合わせと融合を可能にします。
-
ウェイモは「ハイテク自動車事故」に見舞われた。同社のロボタクシーが路上でロボットと衝突し、1分間沈黙した後、静かに走り去った。
-
たった今、Apple初のAIフォン、iPhone 16が誕生しました!
-
清華大学のオープンソース混合精度推論システム MixQ は、大規模モデルのほぼロスレスな量子化を実現し、推論スループットを向上させます。