|
ダークホース「DeepSeek-R1」の台頭は、海外のネットユーザーに東からの衝撃を与えた。 OpenAIとクロードは、一方が「窃盗」を非難し、他方が「後進性」を嘲笑することで、双方の防御を崩した。この相容れないライバル同士が、これほど劇的な形で稀有な合意に達したのだ。 一方、マイクロソフトやアマゾン、さらにはNvidiaなどのクラウドサービスプロバイダーもこの技術を採用し、自社のクラウドプラットフォーム上でDeepSeek-R1のリリースを急いでいる。 しかし、防御を突破するか、本当に魅力的であることが証明されるかに関わらず、DeepSeek-R1 はシリコンバレーを揺るがす「謎の東洋勢力」となった。 DeepSeekは単独で戦っているわけではない。中国における大規模モデリングの全面的な発展も、同社の背後にある。 中国では大型模型が盛んに行われている。中国には、あらゆる分野において、それぞれ独自の特徴を持つ強力な企業が数多く存在します。 DeepSeek-R1を例に挙げましょう。その最大の特徴は極めて低いコストであり、まさにOpenAIとClaudeが弱点と感じていた点です。 検索から生まれた百度は、蓄積してきた技術的経験を自社のモデル製品に適用し、RAG機能を自社モデルの際立った特徴とし、文鑫易言をRAG分野で最強のプレーヤーにしました。 テキストに加えて、音声はより自然な会話方法です。この点において、ByteDanceのDoubaoは強力なエンドツーエンドの対話機能を備えており、複雑な中国語コンテンツに対応し、人間の感情さえも認識できます。つまり、OpenAIの「Her」に全く劣らないと言えるでしょう。 会話関連モデル以外にも、 Kuaishou Kelingはビデオ生成の分野でダークホースとして浮上しており、そのビデオ品質はSoraを上回っています。 克鈴の登場は、国産動画生成モデルの一連の発展を促しました。その後、バイトダンスの集萌、アリババの同益万象、そして大模型六小虎や独立系動画モデルメーカーが、それぞれ独自の製品を発表しました。 国産モデルが成熟したアプリケーションやビジネスモデルを持つようになってから、ようやくOpenAIのSoraが登場したのだが、デモの衝撃的なデビューと比べると、それはありふれた製品のひとつになってしまった。 モデルからアプリケーションへの道のりには、ビデオ生成やテキストダイアログのように名前が分かりにくい機能がありますが、これは重要な役割を果たします。 それは先ほど述べたRAGです。 Baiduが主導するRAGテクノロジーRAG は Retrieval Augmentation の略で、回答を生成する際にモデルがより多くの情報を参照できるようにする検索メカニズムを導入し、回答の精度と豊富さを向上させます。 RAG の重要性は、モデルがいくつかの問題を解決するのに役立つ点にあります。
RAG 機能に関して言えば、中国には百度の Wenxin Yiyan という強力なプレーヤーも存在します。 口先だけで済ませるより、行動で示せ。WenxinとChatGPTの対決を繰り広げよう。 RAG の主な用途はトレーニング後の情報問題を解決することであるため、テストされる質問も時間に敏感である必要があります。 巳年の春節祭の「傘を借りる」コーナーには、何組の緑蛇と白蛇が登場しましたか? (答え:6組) しかし、ChatGPTでは、関連するコンテンツが見つかり、一見正当な方法で動画が提供されていたものの、引用されたリンクには回答が含まれていず、回答内の数字も間違っていました。 しかし、現実のシナリオでは、必ずしも一度に一つの質問だけをするわけではありません。むしろ、一連の質問攻めに遭い、会話の中に欠落が生じる可能性があります。そのため、モデルが質問を理解する能力に対する要求は高くなります。 空の第5の自由とは何ですか?どのような種類の旅客輸送や貨物輸送に利用できますか?空の第8の自由とどう違うのですか? この記事は3つの疑問を的確に捉え、それぞれに正しい答えを提供しました。さらに、表を用いて2つの概念の違いを比較することで、両者の違いを理解しやすくしました。 比較すると、ChatGPT の指摘も正しいのですが、違いは 2 つの概念を別々に紹介しているだけなので、一目でわかるほど明確ではないことです。 一連の質問をするだけでなく、専門性の高い質問をすることで、質問をより難しくすることもできます。 有機化学において、ペリ環式反応はイオンもフリーラジカルも生成しません。なぜこのような反応が起こるのでしょうか? 結局のところ、ウェンシン氏の言葉は私たちの質問に答えるだけでなく、関連する化学反応の概念と分類に関する補足情報も提供し、さらに学習を進めるために最後にビデオレッスンまで含まれていました。 上記のシナリオからわかるように、Wenxin Yiyan の RAG スキルはかなり優れたレベルに達しています。 その背後で、百度は「理解・検索・生成」を協調的に最適化し、質問応答プロセスを3つの段階に分解する検索強化技術を開発しました。
中国の大手インターネット企業の中でも、百度は検索からスタートしたため、検索分野における同社の技術蓄積は他のほとんどの企業に匹敵するものがありません。 Baidu の検索における蓄積された経験は独自の競争上の優位性となり、Baidu が RAG で優れたパフォーマンスを発揮する理由は理解しにくいことではありません。 2025年:中国における大型モデル開発加速の年DeepSeek-R1の登場は、国産モデルが国際舞台でより大きな発言力を獲得したことを意味する。 Andrew Ng 氏も長文の記事を執筆し、国産モデルの革新性を認め、DeepSeek に関する自身の見解を述べています。 アンドリュー・ン氏は、国産モデルと世界トップレベルとの差はどんどん縮まっており、いくつかの側面や技術的な点では、リードする兆しさえ見られると考えています。 さらに、DeepSeek は AI の進歩のための新しいパラダイムを発見し、アルゴリズムの革新を通じてモデル機能の向上を実現し、ハイエンドのコンピューティング能力への依存から解放されました。 さらに、DeepSeekとOpenAIの価格差は30倍もあり、基本モデルの商用化が加速している。 Andrew Ng 氏の結論に従うと、この見通しによれば、大規模モデルが応用段階に入ると、中国の市場規模とユーザーベースは非常に有望になります。 モバイル インターネット時代に中国のアプリがイノベーションのフライホイール上で辿った道筋を再現することさえできるかもしれません。 そのため、DeepSeekは海外で名を馳せただけでなく、国内メーカーの闘志と自信にも火をつけました。 間違いなく、今年、中国ではさらに多くの強力なモデルが誕生し、世界中のネットユーザーにさらなる東洋の驚異をもたらすことになるだろう。 大規模モデルに関する成果を最初に提出した百度は、今年中に最新の大規模モデル「文心5.0」を発表することを明らかにした。 したがって、2025年は、国内のAIが追いつく段階から歩調を合わせる段階に移行し、さらには追い越す年になる可能性が高くなります。 |
DeepSeekが国内大型模型メーカーの闘志に火をつけ、RAGなどのコア技術が再評価されつつある。
関連するおすすめ記事
-
2024 OSCAR オープンソース業界カンファレンスの全議題が公開されました。
-
Nature 認定の DeepSeek を万能研究ツールとして活用:国内の大学は大規模モデルをどう活用できるのか?
-
30万台!長城汽車初のエンドツーエンドインテリジェント運転モデルが発表。魏建軍:「我々はナンバーワンです。階級はありません。」
-
Tencent Meeting は現在、Tencent Hunyuan と Tencent Translate を活用し、17 の言語のリアルタイム翻訳を提供しています。
-
R&D産業用ソフトウェアにおけるオープンソースエコシステムの発展に関する考察
-
最も強力な OpenAI モデルである O1 がテストされました。大学レベルの数学と科学の問題を解くことができますが、IQ の低い人でも難しいと感じるでしょう。