|
「謎の東洋勢力」DeepSeek がシリコンバレーに与える影響は波紋を広げ続けている。 ちょうど今、DeepSeek-R1 は大規模モデル競争のリーダーボードのトップ 3 に入りました。 オープンソースであることと、価格が 20 倍安いことから、ChatGPT-4o (2024.11.20) と並んでリストされています。 R1 は、複雑なプロンプト/スタイル コントロールのリストで 1 位にランクされています。 現在の結果に基づくと、あらゆる面でトップの地位を維持しています。 モデルプログラミング開発能力を測定する WebDev リーダーボードでは、R1 はクローズドソースの Claude 3.5 Sonnet から 40 ポイント未満の差で 2 位にランクされています。 実際にテストしたネットユーザーたちはこれが真実であることを確認しました。R1 は 30 回の戦闘で 4 回か 5 回しか負けませんでした。 一方、シリコンバレーのDeepSeekに対する関心は衰えていない。 所詮は「副業」ですから。 創業者の梁文鋒氏への中国語のインタビューは英語にも翻訳されており、私は虫眼鏡で一語一語丹念に読みました。 彼の意見はことわざにまとめられ、インターネット上で広まった。 本当の違いは1年か2年ではなく、独創性があるか模倣であるかです。 チューリング賞受賞者のルカン氏もDeepSeekについて公正な評価を下した。 それはオープンソースの力を表しています。 オープンソース分野のもう一つの代表であるMetaが、2025年に向けたAI戦略として、コンピューティング能力と人材に650億ドルを投資すると発表したことは注目に値します。 報告によれば、Meta はすでに DeepSeek のせいでパニックに陥っているとのことです。 「彼らは、OpenAI に何度も自らを明確に認識させてくれました。」では、シリコンバレーの観点から見ると、DeepSeek に関するどのような情報が最も重要視されているのでしょうか? 最も重要な疑問は、DeepSeek がどのようにして収益を上げているかです。 私たちが発見した情報はやや予想外のものでした。おそらく、DeepSeek はまだ金儲けを考えていないのでしょう。
第二に、DeepSeekはなぜ成功したのか?梁文鋒が2023年5月と2024年7月にDark Surgeに与えた2つのインタビューも外国人によって発掘された。 彼らが最も重視する 5 つの側面は次のとおりです。 1. イノベーションを第一原則とする:急速な商業化を重視する他の中国AI企業とは異なり、DeepSeekはAGIの基礎研究とイノベーションに注力しています。彼らは、中国は人工知能の世界的な発展において「フリーライダー」から「貢献者」へと変貌を遂げなければならないと考えています。梁文鋒氏は、イノベーションは完全にビジネス主導ではなく、好奇心と創造への意欲も必要だと述べています。 2. 革新的なアーキテクチャ: DeepSeek V2は、革新的なMLA(Multi-Head Latent Attention)アーキテクチャを採用し、メモリ使用量を従来最も一般的に使用されていたMHAアーキテクチャの5%~13%に削減することで、大幅なコスト削減を実現します。推論コストはLlama 370Bの7分の1、GPT-4 Turboの70分の1です。 これは価格競争を狙ったものではなく、単に「コストにわずかな利益を上乗せした価格設定」だったのです。この革新的なアーキテクチャは、V3モデルとR1モデルにも引き継がれました。 3. 独自の企業文化と人材戦略: DeepSeekは完全にボトムアップ型の組織構造を維持し、研究者に無制限のコンピューティングリソースを提供し、資格よりも創造的な情熱を重視しています。彼らの画期的なイノベーションは、海外からの採用ではなく、中国の新卒者や若手技術専門家といった地元の若い才能から生まれています。 4. オープンソースへのコミットメント:業界がクローズドソースモデル(OpenAIやMistral)へと移行しているにもかかわらず、DeepSeekはオープンソースが堅牢な技術エコシステムの構築に不可欠であると信じ、オープンソースへのコミットメントを維持しています。Liang Wenfeng氏は、クローズドソース技術によって築かれた堀は、破壊的技術の前では短命であると主張しています。 彼らの真の価値は、革新的な能力を備えた組織を構築することにあります。 5. 基盤となるコンピューティングの課題:十分な資金と技術力を有しているにもかかわらず、DeepSeekは基盤となるコンピューティング能力に起因する課題とプレッシャーに直面しています。現在、同社は新たな資金調達の計画はありません。Liang Wenfeng氏は、主な制約は資金ではなく、ハイエンドのコンピューティング能力へのアクセスにあると考えています。なぜなら、これらのチップは高度なAIモデルのトレーニングに不可欠だからです。 さらに、インタビューの多くの詳細はネットユーザーによって注意深く調べられました。 元の記事で、梁文鋒氏は「基礎研究を大量に行いながら、定量的な研究を行うことについてどう思いますか?それは資金を浪費することになるのではないですか?」と質問されました。 彼はこう答えた。「刺激的なことは、おそらくお金だけでは測れない。家でピアノを買うのと同じだ。まず、お金が払える。そして、そのピアノで音楽を演奏したいという熱意を持った人たちがいる。」 海外のネットユーザーからは次のようなコメントが寄せられた。 このグループは、やや理想主義的な「テクノロジーマニア」の集まりで、汎用人工知能(AGI)を作れると固く信じています。そのためのリソースと才能も十分に備えています。本当に尊敬しています! さらに、いくつかの比較は避けられません。 梁文鋒は全く異なる考え方を示し、彼らの成功は当然のことです。彼らが「OpenAI」に自らの限界を何度も思い知らせる姿を見るのを楽しみにしています。 もちろん、AI分野全体の発展を見ると、DeepSeekの出現は誰にとっても刺激的です。 商業化という点では、いわば「自ら逃げ道を断った」という点で、少々甘い考えだとは思わざるを得ないが、それでも理想を貫き、成功を収めているチームを見るのは本当に喜ばしいことだ。 R1 の衝撃的なデビューにより、DeepSeek は技術の限界を広げ、オープンソースを遵守し、技術開発に重点を置くという約束を果たしています... それで、DeepSeek はどのようにして今日の地位を確立したのでしょうか? AIを使って定量化し、またAIに戻す梁文鋒は浙江大学で情報電子工学の学士号と修士号を取得しました。 2008 年、Liang Wenfeng 氏は卒業し、機械学習などのテクノロジーを使用して完全に自動化された定量取引を研究するチームを率い始めました。 当時、中国ではクオンツ投資はまだ目新しい概念であり、収益性があるかどうかも不透明でした。2010年にCSI300指数先物が開始されたことで、クオンツ投資の黄金時代が到来しました。公開情報によると、梁文鋒氏のチームはこの波に乗り、瞬く間に5億元を超える自己資金を蓄積しました。 同時に、ディープラーニングの波が動き始め、人工知能が初めてシリコンバレーで誕生しました。 2015年、梁文鋒は卒業生と共にMagic Square Quantを共同設立しました。わずか1年後、彼らは最初のAIモデルをリリースし、GPUを用いた計算でディープラーニングによって生成された最初の取引ポジションを実行しました。 2017年、マジック・スクエア・クオンツは、自社の投資戦略に完全にAIを活用したと主張した。 2018年、Magic Square QuantはAIを同社の主要な開発方向として確立しました。 AIの支援により、環芳クオンツファンドの運用収益は同期間にCSI300指数の収益をはるかに上回り、2019年には運用資産は100億人民元を超えました。 2019年、梁文鋒氏はゴールデンブル賞授賞式で「プログラマーの視点から見た中国の定量投資の未来」と題する基調講演を行いました。これは彼にとって珍しい公の場での講演でした。 スピーチ全体はまさに「プログラマーの視点」に満ちています。 クオンツ投資会社にはファンドマネージャーはいません。ファンドマネージャーは単なるサーバーの集まりです。人間が投資判断を下すのは、直感に基づいた芸術です。プログラムが判断を下すのは、最適な解を求める科学です。 同年、Magic Square QuantはAIコンピューティング能力の大規模展開を開始し、「Firefly-1」クラスターを構築しました。2021年には「Firefly-2」が完成し、このコンピューティングインフラストラクチャはDeepSeekの急速な発展を支える基盤となっています。 2021年、Magic Square Quantは中国で初めて1000億元の大台を突破したクオンツプライベートエクイティファームとなり、中国のクオンツプライベートエクイティの「四天王」の1つとして知られています。 Magic Square Quant の公式サイトでは、大規模モデルの波に直面しても、基礎 AI 科学研究が常に重要な位置を占めていることは特筆に値します。 マジック・スクエア・クオントは、長年にわたり一貫して収益の大部分を人工知能分野に投資し、最先端のAIハードウェアインフラを構築し、大規模な研究を実施し、人類の未知の謎を探求してきたと述べています。 私たちは、ほとんどすべてのイノベーションは大胆な実験と段階的な蓄積から生まれると信じています。 2023年、マジック・スクエア・クオンツは大規模モデルの構築に重点を置く新しい独立組織を「ディープ・エクスプロレーション」と名付け、真に人間レベルの人工知能の創造に注力することを強調しました。 目標は ChatGPT を複製することではなく、AGI に関する未知の情報を調査して発見することです。 DeepSeekの物語はこの瞬間に始まります。 中国の量子市場を揺るがした1980年代生まれのプログラマーは、資金を蓄え、若くエネルギッシュなチームを築き上げた。一見、原点に立ち返りAIへと回帰したかのようだが、彼が生み出したエネルギーは、世界中で大きな波を起こしている。 もう一つ特筆すべきは、マジック・スクエア・クオントが長年にわたり慈善活動に寄付を行ってきたことです。公式ウェブサイトによると、「ありふれた子豚」という名の従業員が、15の慈善団体の23の公共福祉プロジェクトに1億3800万人民元を寄付し、全国の社会的弱者を支援し、社会の公平性と発展を促進しました。 情報筋によると、この従業員は梁文鋒本人だという。 参考リンク: |
DeepSeek-R1はシリコンバレーを揺るがし続けている。ゲームチャートでトップ3にランクインし、創設者のLiang Wenfeng氏のインタビューは綿密に精査された。
関連するおすすめ記事
-
モルガン・スタンレーのヒューマノイドロボットに関するレポートによると、世界トップ100のヒューマノイドロボット企業に中国企業が35社ランクインした。
-
国内大手企業の公式オープンソース Web サイトを調べることで、オープンソースに対する姿勢を把握できます。
-
話題沸騰中!AI分野の古典論文リスト!
-
ゲストの全ラインナップが発表されました!「2024 CCF 中国オープンソースカンファレンス - 大湾区スマートチェーンの未来:インテリジェントコンピューティング産業応用フォーラム」が開催決定!
-
Quark は、Alibaba の「AI 主導」戦略から無限の可能性を引き出し、ユーザー エクスペリエンスを活性化し続けています。
-
ポップアップウィンドウがクロード氏を完全に困惑させ、コンピューターを全く使用できなくなった | スタンフォード大学と香港大学の新たな研究