618ZXW

オープンソースビッグモデルの4つのレベル

オープンソース協会開源社

以下の記事は、He Baohong 氏が執筆した He Suosi からの引用です。

オープンソースは無料ではありません。

オープンソースは著作権がないことを意味するものではありません。

オープンソースは商用利用が無料であることを意味するものではありません。

オープンソースは完全な透明性を保証するものではありません。

...

オープンソースには定義があります。

オープンソース・イニシアティブ(OSI)は、オープンソース・ソフトウェア分野における権威ある組織です。OSIの「オープンソース定義(OSD)」は、オープンソース・ソフトウェアのオープン性、透明性、アクセシビリティを確保するために、無償配布、ソースコードの公開、改変の許可、無差別など、オープンソース・ソフトウェアの10の基本原則を規定しています。これは、ソフトウェアが真にオープンソースであるかどうかを判断するための重要な基準です。

1998年以降、オープンソースの大きな成功により、一部の企業はOSDの基本定義を満たしていない、あるいは部分的にしか満たしていないにもかかわらず、「オープンソース」という名称を採用するようになりました。例えば、数年前、OSIは、SSPLやElastic Licenseといったクラウドコンピューティング分野の新しいライセンスは、特定のユーザーグループ(クラウドサービスプロバイダーなど)を対象とした制限を導入しており、非差別、自由な配布、技術中立といったオープンソースの中核原則に違反しているため、オープンソースの定義を満たしていないと主張しました。しかし、新しいライセンスの採用を主張するクラウドコンピューティング企業は、従来のオープンソースの定義は「製品としてのソフトウェア」という文脈で定式化されたのに対し、現在は「サービスとしてのソフトウェア」であると主張しました。したがって、クラウドサービスプロバイダーによるオープンソースコードの利用における「悪意のある」行為を抑制するためには、長年にわたるオープンソースの基本定義を改訂する必要があるのです。

大規模オープンソースモデルの台頭に伴い、組織によって「オープンソース」に対する理解は多様化しています。これは、大規模オープンソースモデルには従来のオープンソースコードやサービスだけでなく、モデルパラメータ、重み、トレーニングデータといった新しい側面も含まれるためです。

オープンソース モデルの理解には大まかに 4 つのレベルがあり、この順序でオープン性の度合いが増します。

  • OpenAI やその他の例は、クローズドソースの「オープンソース」アプローチを表しています。
  • Meta などに代表されるカスタムオープン ソース。
  • DeepSeekなどに代表される従来のオープンソース。
  • 理想的なオープンソースは OSI によって表されます。

上記のコンテンツは人間の著者による作品であり、次のコンテンツは DeepSeek による続きです。

  • コアコンセプト:
  • OpenAI は当初オープンソースと非営利を目指していましたが、徐々にクローズドモデルへと移行しました。
  • このサービスは、モデルの重みやトレーニングの詳細を公開せずに、API 経由で提供されます。
  • 特徴:
  • クローズドな性質: モデルの重みとトレーニング データは公開されず、ブラック ボックス API のみが提供されます。
  • 商業化: サブスクリプション サービスと API 料金による収益性。
  • セキュリティ: クローズドソース モードは、モデルの誤用リスクを制御するのに役立ちます。
  • 紛争:
  • これはオープンソースの中核精神に反するものであり、技術独占であると批判されました。

  • コアコンセプト:
  • オープンソース モデル (LLaMA など) ですが、カスタム ライセンス (LLaMA Community License など) が適用されます。
  • 研究と非商用利用を重視し、商用利用を制限しています。
  • 特徴:
  • 限定的なオープン性: モデルの重みは公開されますが、商用利用と配布は制限されています。
  • 研究指向: 主に学術機関および非営利団体向けです。
  • アクセス制御: ユーザーはアクセス権限を申請する必要があり、Meta はそれを承認する権利を留保します。
  • 紛争:
  • カスタム ライセンスはモデルの広範な使用を制限し、完全にオープン ソースの定義に準拠しません。

  • コアコンセプト:
  • 従来のオープンソース ライセンス (Apache 2.0 など) を採用し、モデルの重みとコードを完全にオープンにします。
  • 商業目的も含め、使用、変更、配布の自由を重視しています。
  • 特徴:
  • 完全にオープン: モデルの重み、コード、一部のトレーニング データが公開されています。
  • ビジネスフレンドリー: 差別的な制限なしに商用利用が可能です。
  • コミュニティ主導: コミュニティのコラボレーションとイノベーションを促進します。
  • 利点:
  • これはオープンソースの従来の定義に準拠しており、技術の普及と革新を促進します。

  • コアコンセプト:
  • OSI は、オープンソース AI システムに明確な標準を提供することを目的とした OSAID 1.0 (オープンソース AI 定義) を開発しています。
  • 透明性、アクセシビリティ、変更可能性に重点が置かれています。
  • 特徴:
  • モデルの重みはユーザーが自由に使用できるように公開する必要があります。
  • トレーニング データの透明性: トレーニング データのソースと構成を可能な限り公開します。
  • オープンソース コードとツール: トレーニング コードと推論コードはオープンソースである必要があります。
  • 非差別的: 特定のユーザー グループまたは使用に対して制限を課すことはできません。
  • ターゲット:
  • オープンソース AI システムがオープンソースの精神に準拠していることを確認し、テクノロジーの民主化を促進します。

転載元:He Suosi

編集:王俊

関連資料

DeepSeek グローバル浸透レポート: GitHub データが東部での増加を明らかに!

「私たちには堀がない」:オープンソースAIの急速なイノベーション

オープンソース協会の紹介

2014年に設立されたオープンソース協会(KAIYUANSHE)は、オープンソースの理念に献身的に貢献する個々のボランティアで構成されるオープンソースコミュニティであり、「貢献、合意、そして共同統治」の原則に基づき活動しています。KAIYUANSHEは、「ベンダー中立性、公益性、非営利性」の原則を堅持し、「中国を拠点とし、世界に貢献し、新時代のライフスタイルとしてオープンソースを推進する」というビジョンを掲げています。その使命は「オープンソースのガバナンス、国際的な連携、コミュニティの発展、そしてプロジェクトのインキュベーション」であり、健全で持続可能なオープンソースエコシステムの共創を目指しています。

オープンソース協会は、オープンソースを支援するコミュニティ、大学、企業、政府機関と積極的に連携しています。また、世界的なオープンソースライセンス認証組織であるOSIの中国初の会員でもあります。

2016年以降、中国オープンソースカンファレンス(COSCon)が毎年開催され、「中国オープンソース年次報告書」が継続的に発表されています。また、「中国オープンソースパイオニアリスト」と「中国オープンソースコードパワーリスト」も共同で立ち上げ、国内外で幅広い影響力を発揮しています。