|
もうほぼ1ヶ月が経ちました! 過去 1 か月にわたって、世界中の大規模モデル市場は DeepSeek によって混乱に陥りました。 中国国内外の大企業やスタートアップ企業は、次から次へと「DeepSeekについてどう思いますか?DeepSeekが登場したらどうしますか?」といった質問攻めに遭い、不安で頭が真っ白になっている。 話題を完全に避ける人もいれば、積極的に反応する人もいました。 国内では、テンセントなどの企業が昨日、WeChatでDeepSeek-R1を使った「AI検索」機能のグレースケールテストを開始したばかりだ。また、百度は即座に、同社のWenxin Yiyan(検索エンジン)プラットフォームを4月から無料で利用できるようにし、次世代のWenxinモデルをオープンソース化すると発表した。 例えば国際的には、OpenAIが緊急にo3-miniをリリースし、新しいディープ検索エンジンを立ち上げ、o3思考チェーンを公開しました。また、Google DeepMindは新しいGemini 2.0シリーズをリリースし、APIの価格設定機能がDeepSeekよりもさらに競争力のあるモデルGemini 2.0 Flash-Liteを追加しました。 しかし、世界の AI 情勢が変わりつつある一方で、中国では多くの人々がもう一つの問題について懸念を抱いています。 ユニコーン企業となった6つの大規模模型スタートアップ、ZeroOneWorld、Baichuan Intelligence、Jieyue Xingchen、Zhipu Huazhang、Lunar Dark Side、MiniMaxは、業界では「大型模型の6人の小強者」として知られています。 彼らはDeepSeekからの強力な衝撃波にどのように対処しているのでしょうか? 6つの若いチームはこの衝撃にどう反応したのでしょうか?6社のうち、DeepSeekについての意見を表明した企業はない。 しかし、それは彼らが何の行動も起こしていないということを意味するわけではない。結局のところ、高尚なレトリックよりも具体的な行動の方が証明に値するのだ。 注: 以下は、1 月 20 日以降 (含む) の 6 人のメイン キャラクターに対するすべてのアップデートです。 ゼロ、1つDeepSeek-R1 のリリース前、創設者の Kai-Fu Lee 博士は、Zero One Things は今後超大規模モデルのトレーニングを追求しないことを公に述べていました。 6 か月以上の調査と検証を経て、彼らは、適度なパラメータ、優れたパフォーマンス、より速い推論速度、より低い推論コストを備えた軽量モデルが商用シナリオに適しており、「AI ファースト アプリケーションの爆発的な普及のきっかけになるだろう」と明言しました。 DeepSeekの発売後、Lingyiwuが最初に公表したのは蘇州とのコラボレーションでした。 2月14日、ゼロワンシングスと蘇州ハイテク区が共同で設立した大規模産業モデル基地が正式にオープンした。 この大規模モデル拠点は、垂直産業に焦点を当て、製造、金融、ヘルスケア、政府関係、生物学、アバターなど、複数の分野に特化した業界固有の大規模モデルソリューションの構築に重点を置いています。産業チェーン全体にわたる7社を結集し、「実験室から生産ラインに至るまで、大規模モデル技術の産業化への道を探る」ことを目指しています。 イベントで、李開復氏は、人工知能技術が産業を変革しているこの重要な局面において、大規模モデルは決して「空中楼閣」ではなく、むしろ実体経済を動かす中核的なエンジンであると述べた。 Zero One Thingsからの公式声明は次のとおりです。 01Wanwuは1月2日にアリババクラウドと「産業ビッグモデル共同実験室」を設立したことに続き、産業ビッグモデルの分野で再び動き出した。 白川インテリジェントDeepSeek-R1のリリースから5日後の1月25日、Baichuan Intelligenceは新モデルBaichuan-M1-previewをリリースした。 これはBaichuan初のフルシナリオ推論モデルです。「フルシナリオ」とは、言語、視覚、検索の3つの領域にわたる推論能力を備えていることを意味します。 同時に、白川は医学への道を歩み続けています。 Baichuan-M1-previewは、医学的エビデンスに基づくモードを有効化します。公式説明によると、「医学的エビデンスの検索から深い推論まで、エンドツーエンドの完全なサービスを実現し、医学の臨床および研究上の疑問に迅速かつ正確に答えることができます。」 2月13日、百川M1プラットフォーム上に構築された「AI小児科医」が、約1か月にわたる社内テストを経て北京で運用を開始した。 臨床推論では、まず患者の病歴や病歴に基づいて診断および治療の仮説を生成し、次にテストデータを使用してこれらの仮説を反証および排除し、最後に自己反映メカニズムを使用して残りの仮説を確率でランク付けし、臨床思考パスに準拠した診断および治療の提案を出力します。 公式筋によると、北京市立小児病院は中国初となる、AI小児科医と多分野の専門家による多科診療を実施した。参加者には、各科から13名の専門家に加え、同病院、百川智能、そして百川が投資する医療データ企業である小芳健康科技が共同開発した「AI小児科医」も含まれていた。 参加者は、チック症状を伴う頭蓋底腫瘤のある小児に対して多職種による診察を実施し、エンジニアは患者の主な訴えと医療記録をモデルに入力しました。 AI小児科医も専門家パネルの相談結果とほぼ一致する勧告を行った。 跳躍する星DeepSeek-R1 がリリースされた日、Step Star はモデルの更新作業中でした。 1月20日にリリースされた2つのモデルはどちらも言語モデルです。1つは軽量で応答速度が速く、コスト効率に優れたStep-2-miniです。80%以上のパラメータを持つ自社モデルStep-2と比較すると、Step-2-miniは約3%のパラメータで80%以上の性能を維持しています。 もう 1 つの製品は、文学の創作に重点を置き、「創作のために生まれた」Step-2 Literary Master Edition です。 その後2日間、Jieyueは着実なペースで国民に情報を公開し続けた。 21日には、音声認識モデル「Step-1o Audio」のアップグレード版と、マルチモーダル理解モデル「Step-1o Vision」が発表されました。「Step-1o Vision」は発表と同時に大型モデル市場のトップ10入りを果たし、国産視覚モデルでは首位を獲得しました。 22日、動画生成モデル「Step-Video V2」がリリースされました。このバージョンは、従来のV1からVAEモデル、DiTアーキテクチャとRL融合、マルチモーダル大規模モデル応用の3つの側面に重点を置いたアップグレードです。 LeapStarのアプリケーション「LeapQuest」では、モデルのアップデートに加えて、1月24日に新機能「LeapQuest AI Creative Board」もリリースされました。 その機能は「コーディングなしで3ステップでアイデアを実現し、アプリケーションを開発する」こと、そしてその成果をプラットフォーム全体で共有することです。 ちなみに、QuantumBit は以前、LeapQuest が DeepSeek-R1 に密かに接続していたことを発見しました... 春節前の頻繁な活動の中で、Leap Star Systemの責任者であるZhu Yibo氏は、WeChatモーメントでLeap Starが新年以降に大きな動きを見せることを少しだけ示唆した。 この「大きな動き」自体は、2月21日にStep Upが主催する第1回「Step Up Ecosystem Open Day」で明らかになるかもしれません。DeepSeek-R1をターゲットとした具体的な行動や戦略が示されるかどうかについては、来週の会議まで待つ必要があります。 知恵は壮大な章を構成する2月11日、パリのグラン・パレで開催された第3回人工知能アクションサミットのサイドイベント「人工知能技術の進歩と応用」で、清華大学コンピュータサイエンス学部教授であり、Zhipuの創設者でもある唐潔氏が講演した。 同サミットに参加した唯一の大型模型の代表でもあった。 唐潔氏は、AGI の 5 つの段階について説明した後、現在、L2 と L3 の交差点、つまり「機械と人間の意図の整合」と「機械の自己学習」の交差点にいると述べました。 2025年のキーワードの一部を抜粋します。
さらに、DeepSeekの妨害行為に対して、 Zhipuの「対応」は今年初めから頻繁な実行に重点を置くようになりました。 まず、 2月11日にサムスンとの協力を継続します。 具体的には、Agentic GLM(SmartSpectrumが携帯電話専用に開発したシステムレベルの大規模モデル)がSamsungの最新Galaxy S25シリーズの携帯電話に統合され、AIベースのリアルタイム音声通話とビデオ通話のほか、視覚理解、システム機能呼び出し、AI検索、コピーライティングなどの機能を提供します。 (この部分は、確かに同日の唐潔氏の演説の一部と重なります。) 第二に、QuantumBitは、公式発表はされていないものの、Zhipuが最近、ACG(アニメ、コミック、ゲーム)コミュニティで人気のAI描画およびキャラクター作成アプリケーションである「NieTa」とひっそりと協力し始めたことに気づきました。 一方で、Zhipu は自社のビデオモデルで Nieta をリリースし、他方では両社が Zhipu の CogVideoX-2 モデルなどをベースにした Nieta の共同キャンペーンを開始しました。 月の裏側偶然でしょう? DeepSeek-R1のリリースからわずか1時間半後、Dark Side of the Moonの公式WeChatアカウントがKimi k1.5マルチモーダル思考モデルを発表しました。 関連論文「Kimi k1.5: LLM による強化学習のスケーリング」では、k1.5 モデルの設計とトレーニングにはいくつかの重要な要素があることが示されています。 長いコンテキストの拡張。 k1.5 チームは RL のコンテキスト ウィンドウを 128k に拡張しましたが、その背後にある重要なアイデアは、部分的なロールアウトを使用してトレーニングの効率を向上させるというものでした。 戦略の最適化と改善。 k1.5 チームは、long-CoT の RL 式を導出し、堅牢なポリシー最適化のためにオンライン ミラー降下法のバリエーションを採用しました。 簡潔なフレームワーク。 上記 2 つを組み合わせることで、LLM を介した学習のための簡潔な RL フレームワークが提供され、最終的にはモンテカルロ ツリー検索、価値関数、プロセス報酬モデルに依存せずに、より強力なパフォーマンスが実現されます。 マルチモーダル機能。 つまり、テキストと視覚の両方のモダリティで共同推論を実行する能力があります。 2月12日、IOI 2024でo3が金メダルを簡単に獲得したことを紹介したOpenAIの最新レポート論文では、その序文で、DeepSeek-R1とKimi k1.5がそれぞれCoTを通じて大規模モデルの数学的パフォーマンスとプログラミングパフォーマンスをどのように向上させたかについて言及しました。 ミニマックス今1月20日を振り返ると、それはまさに壮大な巨人の戦いでした。 MiniMaxも同日、新モデルを発売した。 T2A-01シリーズの音声モデルをバージョンアップして発売し、Conch Voice製品も発売しました(モデルと製品の両方のプロモーションも行いました)。 T2A-01シリーズには、T2A-01-HDとT2A-01-Turboの2つのモデルがあります。MiniMaxオープンプラットフォームではAPIサービスもご利用いただけます。このシリーズは17言語と数百種類のプリセットサウンドをサポートしています。 この一連のモデルをベースに、Conch AIは最大10,000文字のテキストを入力するだけで、自然で流暢、そして超人間的な音声を生成できます。また、出力音声の感情、話速、ピッチ、さらには必要に応じて音色効果も自由に調整できます。 ここで、1月20日より前に起こった出来事について具体的に触れておきたいと思います。1月15日、MiniMaxの創設者兼CEOであるYan Junjie氏のLatePostとのインタビューが公開され、その中で、当時のMiniMaxの調整と2025年に向けた計画が明らかにされました。 最も重要な点は「オープンソース」であることです。 もしもう一度選択できるなら、最初からオープンソースを選ぶべきだった。オープンソースは技術の進化を加速させるからだ。 これは、MiniMax が同日に発表した MiniMax-01 シリーズ モデルと連動しており、このモデルもリリース時にオープンソース化されました。 その中でも、MiniMax-01は、従来のTransformerアーキテクチャに代わる新しいLightning Attentionアーキテクチャの大規模な拡張を特徴とする最初のモデルであり、モデルが400万トークンのコンテキストを効率的に処理できるようにします。 まとめると、この記事の執筆時点での主要6社の最近の活動は以下のとおりです。 影響を受けたのは6人の若いヒーローだけではありませんでした。もちろん、DeepSeek の R1 リリースは、国内の主要モデル ユニコーン 6 社だけを騒がせたわけではありません。 言い換えれば、国内市場を見てみると、影響を受けているのは6つの小規模なテクノロジー大手だけではなく、どのテクノロジー大手やAIモデル企業も影響を受けないわけではない。 困難の中で、新たな視点や新たな変化が生まれます。 例えば、DeepSeek 社が「画期的な技術革新を追求するため、業界経験が不十分な若い技術者を大胆に採用している」という話は広く流布され、各企業の採用基準の定義に新たな疑問が投げかけられています。 たとえば、百度は文心易眼をまもなく無料化すると発表した後、すぐにクローズドソースのビッグモデルを放棄することを決定し、今後数か月以内に文心ビッグモデル 4.5 シリーズをリリースし、6 月 30 日に正式にオープンソース化する予定です。 DeepSeek が期待されていたかどうか尋ねられたとき、ロビン・リー氏は最近のドバイ AI サミットで率直に認めました。 イノベーションは計画することはできないと私は信じています。 課題の中で、新たな展開と新たな機会が生まれました。 クラウドコンピューティングベンダーやAIインフラプラットフォーム/企業は、DeepSeek APIをいち早くリリースし、本格的な671Bバージョンを順次搭載するだけでなく、切り捨て率、応答速度、精度などの最適化を競い合っています。中には、ローカル展開に有利なフレームワークもリリースし、大規模モデル推論の障壁をさらに打ち破っています。 DeepSeek からの大量のユーザー流入を逸らし、より多くのユーザーがさまざまなチャネルを通じて AI を活用できるようにします。 一方、テンセントを例に挙げると、テンセントクラウド、テンセントクラウドの大型モデル知識アプリケーション開発プラットフォームKnowledge Engine、国民的アプリケーションWeChat、AIインテリジェントワークベンチIMA、主要AIアプリケーションYuanbaoはいずれもDeepSeekを採用し、R1モデルの統合を発表し、独自の機能を活用してユーザーエクスペリエンスを向上させています。 Huawei、Alibaba、ByteDanceなどの大手企業も、そのアプリケーションやチームとともに、すべて同じことを行っています。 これらはオープンで互換性があり、DeepSeek だけでなく、「完全に自社開発」されたモデルかどうかに関係なく、最高のユーザー エクスペリエンスを備えたモデルも採用しています。 諺にあるように、これは神々の戦いであり、人間にとっては掘り出し物を見つけるチャンスであり、AI はすべての人に利益をもたらします。多ければ多いほど楽しいのです。 もちろん、荒れた海を航行していたのは国内船だけではなかった。 国際的な状況を見ると、DeepSeek はウォール街のアナリスト会議で最も頻繁に言及される AI 企業の 1 つになっています。 Alphabet(Googleの親会社)、AMD、Palantir、Amazonなどのテクノロジー大手が収益を発表するにつれ、DeepSeekの名前がますます頻繁に挙がるようになっています。 外国メディアはこの「盛大な行事」を非常に簡潔な文章で表現した。 「ディープシーク、ディープシーク、ディープシーク。」 特に海外の大型模型愛好家たちの間では、「DeepSeekの衝撃波」に狂乱する者もいれば、それを反省しそのエッセンスを抽出する者もいる。 大手企業の「対応」における包括的な姿勢を知るには、次の一例だけで十分です。 OpenAIは緊急にo3-mini推論モデルを初めてユーザーに無料でリリースし、CEOのアルトマン氏もRedditのQ&Aセッションで珍しく公の場での意見を述べた。 オープンソースの重み付け AI モデルの問題に関しては、(私の意見では)私たちは歴史の間違った側に立ってきました。 昨年12月末に確固たる足場を築き、12日間連続で生放送するという断片的な戦略は消えた。 OpenAI は現在、数週間以内の GPT-4.5 のリリース、数か月以内の GPT-5 のリリース、モデル ロードマップ計画の調整、既存モデルの反復的な更新など、1 日で複数の新しい開発を発表できるようになりました。 大型の模型レーストラックを越えて、DeepSeekの破壊的な影響は誰の目にも明らかです。 DeepSeek は、多数のサードパーティが R1、V3、およびその他のモデルと統合して連携するための道を開きました。 不完全な統計によると、インフラプラットフォーム、携帯電話メーカー、Web/アプリアプリケーション、インテリジェント運転端末など 100 を超えるサードパーティが DeepSeek モデルと統合されています。 GitHub では、V3/R1 のスターの数が増え続けていることから、DeepSeek を使用する人が増えていることがわかります。 そうすると生態系は繁栄し、生命は無限に続いていきます。 その結果、深海クジラはAGIのさらに奥深くまで探検し、R1深海砲弾を投下した後、新たなミームが広まり始めました。 DeepSeek の影響による結果は何ですか? 「鯨が浮上すると、すべてのものが生き返る」です。 |
6 つの主要モデルは DeepSeek の影響にどのように対応するのでしょうか?
関連するおすすめ記事
-
DeepSeek R1 Zero を再現するための中国語チュートリアルがここにあります!
-
今週の金曜日に北京でお会いしましょう!
-
初のハイブリッド推論モデル「Claude 3.7」がリリースされました!優れたプログラミング能力を誇り、思考時間のコントロールも可能です。
-
Qujing Technology は、大規模な知識推論オールインワンマシンをリリースし、企業が効率的な推論を実現できるようにするための「フルシステム推論アーキテクチャ」の先駆者となりました。
-
Transformer の作者が警告: 単にモデルを販売するだけでは OpenAI と競合できません!
-
高エントロピー合金に新たな発見!複数のチームが協力し、耐酸化性の高精度予測を実現。アルミニウム、クロム、シリコンの含有量を増やすことで、耐酸化性を効果的に向上させることができます。