618ZXW

オープンソースの大規模モデルである DeepSeek は、具体的に何を提供するのでしょうか?

オープンソース協会開源社

以下の記事は CSDN から引用したもので、New Programmer 編集部が執筆したものです。

【導入】

読者は、この記事の最後にある「関連資料」セクションにある He Baohong 博士の記事「オープンソースの大規模モデルの 4 つのレベル」をガイドとして参照することをお勧めします。

—Liu Tiandong、オープンソースソサエティの共同創設者、2024年理事、ASFメンバー

DeepSeekが世界中で広く普及し、様々なメーカーやプラットフォームに採用された理由を議論する中で、「オープンソース」が最も重要なキーワードの一つとなりました。チューリング賞受賞者のヤン・ルカン氏は、これを「オープンソースの勝利」と呼びました。オープンソースモデルは常に注目を集めており、コードやデータからモデル自体に至るまで、完全なオープンソース化が求められています。では、DeepSeekは一体何を、どの程度までオープン化したのでしょうか?この記事では、シニアプログラマー兼弁護士が執筆し、DeepSeekのオープンソースアプローチを解説します。

DeepSeekは現在、クローズドソースの大規模モデルに匹敵するオープンソースの大規模モデルであり、DeepSeekライセンスは責任あるAIライセンスです。Linux Foundationのオープンモデルアーキテクチャによると、DeepSeekのオープンレベルはまだレベル3に完全には達していません。DeepSeekの大規模モデルの使用または配布は、ユースケースの制限を含め、DeepSeekライセンスに準拠する必要があります。欠点は、DeepSeek自体が遵守義務のあるオープンソースライセンスを完全に遵守していない可能性があることです。

DeepSeekの進化には、V2、V2.5、V3、R1-Zero、R1などのバージョンがあります。その中で、V3モデルの評価に使用されたベンチマークテストには、MMLU、MMLU-Redux、MMLU-Pro、C-Eval、CMMLU、IFEval、FRAMES、GPQA Diamond、SimpleQA、C-SimpleQA、SWE-Bench Verified、Aider、LiveCodeBench、Codeforces、中国全国数学オリンピック(CMO)、アメリカ招待数学競技会(AIME)などがあります。V3のテスト比較結果によると、V3はオープンソースモデルの中で最も優れた性能を示しており、最先端のクローズドソースモデルと比較しても競争力を示しています。テスト比較結果は次のとおりです[1]。

図1. DeepSeek-V3モデルテストの比較結果

R1の画期的な貢献は、大規模モデルの能力向上に教師あり微調整(SFT)ではなく強化学習(RL)を用いた点にあります。R1のテスト結果は、いくつかのテスト項目においてOpenAIのo1を上回っています。R1のテスト比較結果は以下の通りです[2]。

図2. DeepSeek-R1モデルテストの比較結果

クローズドソースのOpenAIが遥かに先を行くと思われた矢先、DeepSeekのオープンソース大規模モデルの登場は、計り知れない不確実性をもたらしました。PC時代のLinux、モバイル時代のAndroidのように、私たちはオープンソースに依然として大きな期待を寄せています。人類はAI時代の「不確実性」に期待を寄せているのです(記事「1万字の長文!大規模モデルの著作権帰属問題を徹底分析」参照)。

DeepSeekはHugging Face [3]に関する68のモデルと1つのデータセットを公開しています。DeepSeek-R1およびDeepSeek-R1-Zeroモデルのコードとモデルの重みはMITライセンスの下でライセンスされています。その他のモデルはDeepSeekライセンスの下でライセンスされていますが、コードはMITライセンスの下でライセンスされています。各モデルで使用されているオープンライセンスは以下の通りです。

表1 DeepSeekモデルライセンス

注: 「Hugging Face」ではシリアル番号は時系列順に並んでおり、シリアル番号が小さいほどタイムスタンプが古いことを示します。

上記の主要モデルに加えて、DeepSeekはQwenとLlamaから6つのモデルを抽出しました。抽出されたモデルはMITライセンス、QwenベースモデルはApache 2.0ライセンス、LlamaはLlamaライセンスの下でライセンスされています。

表2 蒸留モデルライセンス

LF AI&Data Foundationが導入したモデルオープンネスフレームワーク(MOF)によれば、大規模モデルのオープン性は次の3つのレベルに分けられます[4]。

図3. モデルのオープンフレームワーク

DeepSeek-R1 と DeepSeek-V3 を例にとると、DeepSeek オープン レイヤーについての私の理解は次のとおりです。

表3. DeepSeekモデルのオープンレベル

上記の表に示すように、DeepSeekはモデルアーキテクチャ、モデルカード、モデルパラメータ、技術レポート、評価結果へのアクセスを提供しています。したがって、 DeepSeekのオープンレベルは最大でレベル3です。DeepSeekは、トレーニングコード、推論コード、評価コード、データセットといっ​​たより重要なコンポーネントへのアクセスは提供していません。

R1 シリーズ モデルを除くすべての DeepSeek モデルは、DeepSeek ライセンスに基づいてライセンスされます。

前述の通り、DeepSeekはデータをほとんど公開していません。「データ」とは、モデルの学習、事前学習、あるいはその他の評価に使用されるデータセットから抽出された情報やコンテンツの集合を指します。そのため、DeepSeekのライセンスでは、データは当該ライセンスの対象外であることが明示的に規定されています。

DeepSeekのモデルライセンスは、Responsible AI License (RAIL)[5]をモデルにしています。もちろん、RAILの原型はApache 2.0ライセンス[6]です。

(a)使用制限

RAILは、無責任で有害なアプリケーションを防止するように設計されています。そのため、RAILライセンスには使用制限が含まれています。具体的には、DeepSeekライセンスでライセンスされたモデルは、以下の状況では使用できません。

  • 適用される国内法または国際法や規制に違反すること、またはいかなる方法でも第三者の正当な権利や利益を侵害すること。
  • いかなる形態においても軍事目的のため;
  • いかなる方法においても未成年者を搾取し、危害を加え、または搾取もしくは危害を加えようとする行為。
  • 他人に危害を加える意図を持って検証可能な虚偽の情報および/またはコンテンツを作成または配布すること。
  • 適用される規制要件に従って不適切なコンテンツが生成または配布される。
  • 許可なく、または合理的な使用なしに個人を特定できる情報を生成または配布すること。
  • 他人を中傷、蔑視、またはその他の方法で嫌がらせすること。
  • 完全に自動化された意思決定では、個人の正当な権利に悪影響を及ぼしたり、拘束力のある強制可能な義務が作成または変更される可能性があります。
  • 個人またはグループを差別したり傷つけたりすることを意図した、またはその効果を持つ、オンラインまたはオフラインの社会的行動、または既知または予測される個人的または性格的特性に基づく使用。
  • 特定の集団の年齢、社会的、身体的、精神的特徴に基づいてその集団の弱点を悪用し、その集団の構成員の行動を著しく歪め、それによってその個人または他の人に身体的または心理的危害を与える、または与える可能性のあること。
  • 法的に保護されている特性またはカテゴリに基づいて個人またはグループを差別することを意図した、またはその効果を持つ使用。

R1モデルで使用されているMITライセンスには、いかなる制限事項も記載されていません。DeepSeekライセンスはMITライセンスよりも多くの制限事項があるように見えますが、実質的な制限事項はおそらく「いかなる形態であっても軍事目的で使用する」ことだけです。その他の制限事項は、記載の有無にかかわらず、現代の国内法では基本的に違法です。

上記の制限とは別に、ユーザーは DeepSeek モデルを使用して、あらゆるモデルを作成、微調整、更新、実行、トレーニング、評価、および/または再パラメータ化できます。

(ii)知的財産ライセンス

DeepSeekは、モデル、モデル派生物、および補足資料のライセンス(著作権および特許ライセンスを含む)を付与します。ライセンス条件は以下のとおりです。

2. 著作権ライセンスの付与。本ライセンスの条件に従い、DeepSeekは、お客様に、補足資料、モデル、およびモデルの派生作品を複製、準備、公開、実行、サブライセンス、および配布するための、永続的、全世界的、非独占的、ロイヤリティフリー、取消不能な著作権ライセンスを付与します。

3. 特許ライセンスの付与。本ライセンスの条項および条件に従い、該当する場合、DeepSeekは、お客様に、モデルおよび補足資料を作成、委託、使用、販売の申し出、販売、輸入、およびその他の方法で配布するための、永続的、全世界的、非独占的、無償、取消不能(本項に別途記載されている場合を除く)な特許ライセンスを付与します。ただし、かかるライセンスは、DeepSeekがライセンス許諾でき、かつお客様の貢献によって必然的に侵害される特許請求の範囲にのみ適用されます。お客様が、モデルおよび/または補足資料が直接または共同で特許侵害を構成していると主張して、何らかの団体に対して特許訴訟(交差訴訟または反訴を含む)を提起した場合、本ライセンスに基づきお客様に付与されたモデルおよび/または作品に関する特許ライセンスは、かかる請求または提出の日付で終了します。

著作権と特許権を付与する条件は、最も一般的な Apache 2.0 ライセンスの条件と実質的に同一です。

(iii)分配および再分配の条件

第三者のリモート アクセス目的 (SaaS など) で DeepSeek モデルまたはその派生物の複製 (変更の有無にかかわらず) をホスト、コピー、配布する場合、配布者または再配布者 (総称して「配布者」) は次の条件を満たす必要があります。

a. 配布者は、モデルまたはモデル派生物の使用および/または配布を規定する法的契約(ライセンスなど)に上記の使用制限を強制力のある条項として組み込む必要があり、また、モデルまたはモデル派生物がこれらの使用制限の対象となることを第三者の受領者に通知する必要があります。この条件は補足資料の使用には適用されません。「補足資料」とは、モデルの定義、実行、読み込み、ベンチマーク、または評価に使用される付属のソースコードおよびスクリプト、ならびにトレーニングまたは評価の準備に使用されるデータ(存在する場合)を指し、付属のドキュメント、チュートリアル、例など(存在する場合)も含まれます。

b. 販売業者は、モデルまたはモデル派生物の第三者受領者にDeepSeekライセンスのコピーを提供する必要があります。

c. 配布者がさらに変更を加える場合は、変更された文書に、その文書が変更されたことを示す目立つ声明を添付する必要があります。

d. 販売業者は、モデルまたはその一部に関係のない通知を除き、すべての著作権、特許、商標、および帰属に関する通知を保持する必要があります。

e. 配布者が変更を加える場合、配布者は、変更に対して独自の著作権表示を追加し、変更された部分、または変更されたモデルの派生作品の全体の使用、複製、配布に関する追加または異なるライセンス条項を規定することができます(ただし、a)項の使用制限が満たされていることを条件とします)。ただし、配布者による DeepSeek モデルの使用、複製、配布は、DeepSeek ライセンスに定められた条件に準拠するものとします。

配布者がコンテンツの配布または再配布においてこれらの条件を満たさない場合、契約違反(DeepSeekライセンス契約違反)またはDeepSeekライセンスに基づいて付与された著作権および特許の侵害となる可能性があります。各国の法律に基づき、配布者は一般的に、侵害の差し止めや損害賠償を含む法的責任を負います。

DeepSeekは、それぞれQwenモデルとLlamaモデルに基づいて蒸留モデルを派生させました。これらの蒸留モデルを使用または配布するには、蒸留モデル自体のMITライセンス要件に加えて、基盤となるモデルのライセンス要件も満たす必要があります。QwenモデルはApache 2.0ライセンス、LlamaモデルはLlamaライセンスに基づきライセンスされています。従来のMITライセンスおよびApache 2.0ライセンスのライセンス条件については、ここでは詳しく説明しません。Llama 3.3ライセンスを例に挙げると、ライセンスの第1条は、使用および配布を以下のように制限しています。

i. Llamaマテリアル(またはその派生作品)またはそのコンテンツ(他のAIモデルを含む)を含む製品もしくはサービスを配布または提供する場合、(A) 当該Llamaマテリアルに本契約書のコピーを添付し、(B) 関連するウェブサイト、ユーザーインターフェース、ブログ記事、「About」ページ、または製品ドキュメントにおいて「Built with Llama」と強調表示するものとします。LlamaマテリアルまたはLlamaマテリアルの出力もしくは結果を用いて、配布または提供されるAIモデルを作成、トレーニング、微調整、またはその他の方法で改良する場合は、当該AIモデルの名称の先頭に「Llama」を含めるものとします。

ii. 統合されたエンドユーザー製品の一部としてライセンシーからLlamaマテリアルまたはその派生作品を受け取った場合、本ライセンスの第2条は適用されません。

iii. 配布されるLlama資料のすべての複製物には、以下の帰属表示を記載しなければなりません。この表示は、当該複製物の一部として配布される「Statement(声明)」テキストファイルに記載されるものとします。「Llama 3.3は、Llama 3.3コミュニティライセンスに基づいてライセンス供与されます。Copyright © Meta Platforms, Inc. All rights reserved.」

iv. ラマ素材の使用は、適用される法律および規制(貿易コンプライアンス法および規制を含む)ならびにラマ素材利用規定(https://www.llama.com/llama3_3/use-policy で入手可能)を遵守する必要があり、この規定は参照により本契約に組み込まれます。

ライセンスの第 2 条は、商業利用に制限を課す追加の商業条件です。

Llama 3.3のリリース日において、ライセンシーまたはその関連会社が提供する製品またはサービスの月間アクティブユーザー数が前暦月の月間アクティブユーザー数7億人を超えた場合、Metaにライセンスを申請する必要があります。Metaは独自の裁量によりライセンスを付与することができ、Metaが明示的に権利を付与しない限り、お客様は本契約に基づくいかなる権利も行使する権利を有しません。

DeepSeek-V3およびDeepSeek-R1のモデルコードファイルmodeling_deepseek.py[7]は、EleutherAIのGPT-NeoXライブラリと、その中のGPT-NeoXおよびOPT実装から派生しており、Meta AIチームがモデルを学習したGPT-NeoXとOPTの微妙なアーキテクチャの違いに対応するために、元の形式から変更されています。modeling_deepseek.pyファイルには、「# Copied from transformers.models.llama.modeling_llama.LlamaDynamicNTKScalingRotaryEmbedding with Llama->DeepseekV3」のようなコメントもいくつかあります。EleutherAIのGPT-NeoXライブラリは、Apache 2.0ライセンス[8]の下でライセンスされています。

したがって、DeepSeek が Apache 2.0 ライセンスの下で配布されるモデル マテリアルを統合する場合は、Apache 2.0 ライセンスの規定にも準拠する必要があります。また、DeepSeek が Llama ライセンスの下で配布されるモデル マテリアルを統合する場合は、Llama ライセンスの規定にも準拠する必要があります。

DeepSeek は Qwen および Llama ビッグ モデルを抽出しており、当然ながら Qwen ビッグ モデルで使用される Apache 2.0 ライセンスと、Llama ビッグ モデルで使用される Llama ライセンスにも準拠している必要があります。

Llamaライセンス(Llama 3.1を例に挙げます)に基づき、DeepSeekは販売代理店として、(A) Llamaマテリアルと共にLlamaライセンスのコピーを提供し、(B) 関連するウェブサイト、ユーザーインターフェース、ブログ記事、Aboutページ、または製品ドキュメントに「Built with Llama」という文言を目立つように表示する必要があります。Llamaモデルからの抽出にはLlamaモデルマテリアルが使用されるため、抽出されたモデル名の先頭には「Llama」を含める必要があります。さらに、宣言テキストファイルには、以下の帰属表示文を含める必要があります。「Llama 3.1はLlama 3.1コミュニティライセンスに基づきライセンス供与されています。著作権 © Meta Platforms, Inc.、無断複写・転載を禁じます。」

上記の分析に基づくと、 DeepSeek は、対応する大規模モデルの配布資料に配布ライセンスのコピーを含めず、「Llama で構築」を強調表示せず、帰属表示ステートメントを保持していないという点で、オープンソース ライセンスに完全に準拠していないことがわかります。

DeepSeek自体はオープンソースライセンスを完全に遵守しているわけではないかもしれませんが、これらの小さな欠陥にもかかわらず、その驚異的なパフォーマンスは、大規模なオープンソースモデルに対する世界的な期待を高めています。これは、他者がDeepSeekモデルの使用および配布において、単にそれに倣えばよいという意味ではありません。むしろ、ユーザーと配布者は、他者に損失を与えないという精神に基づき、オープンソースライセンスに定められた使用および配布の制限を厳格に遵守し、責任ある人工知能の世界を構築する必要があります。

関連情報リンク:

[1] https://arxiv.org/html/2412.1...

[2] https://arxiv.org/html/2501.1...

[3] https://huggingface.co/deepse...

[4] https://lfaidata.foundation/blog/2024/04/17/introducing-the-model-openness-framework-promoting-completeness-and-openness-for-reproducibility-transparency-and-usability-in-ai/

[5] https://static1.squarespace.c...

[6] https://www.apache.org/licens...

[7] https://huggingface.co/deepse...\_deepseek.py

[8] https://github.com/EleutherAI...

転載元:CSDN

編集:王俊

関連資料

DeepSeek グローバル浸透レポート: GitHub データが東部での増加を明らかに!

オープンソースビッグモデルの4つのレベル

オープンソース協会の紹介

2014年に設立されたオープンソース協会(KAIYUANSHE)は、オープンソースの理念に献身的に貢献する個々のボランティアで構成されるオープンソースコミュニティであり、「貢献、合意、そして共同統治」の原則に基づき活動しています。KAIYUANSHEは、「ベンダー中立性、公益性、非営利性」の原則を堅持し、「中国を拠点とし、世界に貢献し、新時代のライフスタイルとしてオープンソースを推進する」というビジョンを掲げています。その使命は「オープンソースのガバナンス、国際的な連携、コミュニティの発展、そしてプロジェクトのインキュベーション」であり、健全で持続可能なオープンソースエコシステムの共創を目指しています。

オープンソース協会は、オープンソースを支援するコミュニティ、大学、企業、政府機関と積極的に連携しています。また、世界的なオープンソースライセンス認証組織であるOSIの中国初の会員でもあります。

2016年以降、中国オープンソースカンファレンス(COSCon)が毎年開催され、「中国オープンソース年次報告書」が継続的に発表されています。また、「中国オープンソースパイオニアリスト」と「中国オープンソースコードパワーリスト」も共同で立ち上げ、国内外で幅広い影響力を発揮しています。