なぜ大企業はオープンソースとクローズドソースのどちらかを選ぶのでしょうか?

オープンソース協会開源社

以下の記事は発電所からのもので、張勇一氏が執筆したものです。

2024年世界人工知能会議において、ロビン・リー氏は大規模モデルは「オープンソースかクローズドソースか」という議論を改めて解説し、中国における大規模モデルの現在の応用シナリオは熾烈な競争環境にあると述べた。「同業他社よりも高いビジネス効率と低いコストを実現できる者だけが、大規模モデルを際立たせることができる。この場合、商用化されたクローズドソースモデルこそが業界の未来だ。」

また、現在は小規模のクローズドソースモデルでも、同規模のオープンソースモデルよりも優れたパフォーマンスを発揮していることも強調しました。

ロビン・リー氏が今年同様の見解を表明したのは今回が初めてではない。2024年初頭から、リー氏は主に講演など様々な場面で、「クローズドソースは最終的にオープンソースに勝利する」という百度の見解を公に主張してきた。

このような議論はほとんどの場合かなりの論争を巻き起こしますが、それはまた、過去1年ほどの大型模型業界の探求と発展の間に業界で徐々に現れてきた2つの主流の視点を直接反映しています。業界の物議を醸すトピックについて一貫して意見を表明してきた周紅毅のような人々に加えて、業界の主なスター大型模型スタートアップチームは基本的にオープンソースの大型模型を明確に支持しており、オープンソースの方法を通じて業界での影響力を拡大し続けています。

大企業の分野では、中国と米国の両方に、それぞれオープンソースとクローズドソースをサポートする大企業が存在します。クローズドソース陣営には、OpenAI、Google、Baidu が含まれ、オープンソース陣営は主に Meta、Tencent、Alibaba によって代表されています。

テクノロジー大手の多様なニーズと比較すると、スタートアップ企業がオープンソースをサポートする理由は比較的統一されています。現段階でスタートアップ企業が直面する主な問題はすべて、「オープンソース」アプローチを通じて解決できるからです。

Zero One Things のオープンソース事業責任者である Lin Lüqiang 氏によると、スタートアップ企業がオープンソースを選択し、さらには多くのチームがオープンソースに全面的に移行することを選択する理由は、基本的にそれが市場の現状を打破する最も効率的な方法だからだという。

「オープンソースであることは、最も重要なリトマス試験紙でもあります。（モデルの）性能が十分に優れていなければ、たとえオープンソースであっても、結局は誰も注目しなくなります」と、ユニコーン・ビッグモデルチームの海外展開プロジェクトに参加したアプリケーションプロダクトマネージャーは、発電所から記者に語った。

これはユニコーンやスタートアップに限ったことではなく、MetaとOpenAIの競争でも同様の現象が見られます。すでに膨大なリソースを蓄積している巨大企業にとって、オープンソースを通じて事実上の標準を確立することは、競争の中で迅速に市場シェアを獲得するための重要な手段です。

オープンソースコミュニティの強力な後ろ盾を得て、OpenAI の投資家である Microsoft でさえも、立場を軟化させ、LLama の最大のパートナーとなるための主導権を握らざるを得ませんでした。なぜなら、世界で最も重要なクラウドサービスプロバイダーである Microsoft が、オープンソースコミュニティの主流の選択に背を向けることは当然できなかったからです。

オープンソースは、大規模モデル開発チームにとって、更なる発展を目指すための重要な手段です。この特徴は、特にユニコーン企業における「グローバル化」の潮流が続く中国の大規模モデル開発チームにも顕著に表れています。The Informationによると、中国を代表するAIユニコーン企業の一つであるDark Side of the Moonは、既に米国市場への進出準備を進めています。同社は米国で関連人材を採用し、チームを編成し、カリフォルニアに現地オフィスを設立する予定です。

中国のAIスタートアップ企業は、複数の国に同時に新しいオフィスを設立しています。グローバル展開の重要な前段階として、オープンソースは海外展開における最も重要な目標の一つである人材育成の達成に非常に有益です。オープンソースプロジェクトの継続的な出現により、中国のスタートアップ企業は既に世界的なオープンソースコミュニティにおいて重要な地位を確保しており、中国の大規模モデルチームが海外展開においてオープンソースを選択する意欲をさらに高めています。

オープンソースは本質的に双方にメリットのある状況であるため、「オープンソースには将来がない」と公に宣言することは、大多数の開発者に反対する立場を取ることにほぼ相当します。

百度は、既存事業の拡大においても開発者コミュニティに依存しているプラットフォーム大手として、あえて率先してこのタブーを頻繁に犯している。その理由は、業界におけるクローズドソースの大規模モデルの商業化を促進することで、自社の大規模モデルの初期学習に投入したコンピューティングリソースとコストを早急に回収する必要があるからに他ならない。

オープンソースには多くのかけがえのない利点があるものの、中国における大規模産業モデルの探求において得られたコンセンサスは、少なくとも当面は、オープンソースとクローズドソースの大規模モデルの間には依然として技術的な格差が存在するというものである。これが、クローズドソースの大規模モデルの商業的価値がオープンソースモデルよりも高い主な理由である。

過去1年間の大規模モデルの業界応用事例に基づくと、クローズドソースの大規模モデルは確かにユーザーに人気があります。その主な理由は、ユーザーの実際のニーズがそれぞれ異なること、そしてオープンソースモデルはより複雑な垂直領域の問題を扱う際に推論能力が不足することが多いことです。

大規模モデルの導入事例を長年観察してきたアナリストによると、この問題を解決する最も理想的な方法は、クローズドソースモデルのプライベート展開です。このプロセスでは、クローズドソースコードを使用することで、パートナーから提示される様々な要件をより迅速かつ効率的に満たすことができます。イテレーション速度が速くなるだけでなく、更新とイテレーションはユーザーのニーズにより的確に反映されます。

クローズドソースは、アプリケーションの有効性に責任があることに加えて、ユーザーデータの安全性と制御性を高めるためのプロモーション戦略でもあります。オープンソースモデルは現在、コードレビューシステムやデータプライバシートレーニングなどの独自のガバナンスメカニズムを重視していますが、プライバシー漏洩のリスクを根本的に解決することはできません。

これは潜在的なリスクであるだけでなく、実際のプロモーションにおける大規模モデルのパフォーマンスに対するユーザーの信頼にも大きく影響します。中国のクローズドソースモデルは、多くの場合、大企業のブランド承認を受けており、これはオープンソースとクローズドソースの大規模モデル間の競争における特別な利点であり、大規模モデル監視の分野における説明責任チェーンの最後のリンクでもあります。

これは、政府、企業、工学・医療分野におけるモデル製品の応用において最も顕著です。2023年8月、北京市衛生健康委員会は「北京市インターネット診療監督実施弁法（試行）」を策定・公表しました。この弁法では、AIによる処方箋の自動生成や医師の代替による医療サービス提供が明確に禁止されています。これは、これまで業界で最も懸念されていた「AIの誤判断によって患者が被害を受けた場合、どのように責任を問うのか？」という問題への対応策です。

現在、様々な業界における大規模モデルの応用は、依然として模索と試行錯誤の初期段階にあります。そのため、多くのユーザーは規制や説明責任のメカニズムに対して極めて保守的な姿勢を取る傾向があります。しかし、これは、中国における様々な分野における大規模モデルの応用が、ほぼ常にデータ品質の不足という問題に直面しているという事実と矛盾しています。

モデルの学習と開発を加速させるには、オープンソースモデルとクローズドソースモデルの両方において、モデルフィードバックの品質向上のため、垂直分野からの大量の合成データが必要です。より明確な説明責任と迅速なフィードバック応答メカニズムを備えたクローズドソースの大規模モデル製品は、こうした需要を満たす上で独自の役割を果たすことがよくあります。

現在入手可能な情報によると、大手クローズドソースの大規模モデル企業は、ローカライズされたモデル展開サービスを提供しながらも、直接的な学習に伴う潜在的なリスクを様々な手段で回避していることが多い。彼らは、匿名化、データ匿名化、汎化といった技術を用いてユーザーデータを匿名化し、セキュリティリスクを最小限に抑えている。これらは、百度やテンセントといった伝統的なインターネット大手が最も優位に立つ分野であり、彼らはクローズドソースの大規模モデルをこれらの要件に適合させるための豊富な運用経験を蓄積している。

「大規模モデルのコードをオープンソース化しても意味がありません。なぜなら、その中核的な価値はコードからデータやトレーニング手法へと移行しているからです。」実際、大規模モデルが現在採用している「オープンソース」は、従来のコード分野で理解されている「オープンソースコード」の概念とは異なります。

「最大のオープンソースモデルプラットフォーム」を自称してきたLlama2は、実際には従来のオープンソースライセンスに準拠していません。Metaがカスタマイズした独自のライセンスを採用しており、このライセンスにはMeta独自の条件が多数含まれています。例えば、プロジェクトの月間アクティブユーザー数が7億人を超えた場合、Metaがオープンソースライセンスを継続するかどうかを決定する権利を有すると明記されています。これは、大規模モデルを扱う現在のオープンソース環境において、曖昧な点となっています。

RWKVの共同創業者である羅玄氏は、「オープンソースは商業化の反対語ではなく、独占を打ち破ることを意味します」と述べています。Llama 2シリーズモデルのオープンソース化が業界を揺るがす重大な出来事となったのは、オープンソースには依然として業界への応用に限界があるものの、企業にとっては応用のハードルを大幅に下げたからです。

この点において、大企業も中小企業もオープンソースの恩恵を受ける機会を持っています。オープンソースの影響を最も深刻に受けるのは、その中間に位置する様々な規模の「中堅企業」です。中堅企業は大企業に比べて投資力がはるかに小さいだけでなく、スタートアップのようにオープンソースの道を完遂することも困難です。

多数のオープンソース貢献者がコミュニティに統合され、業界に新たな活力とアイデアをもたらし続ける限り、Llama 2 のような新しい変数が出現し続け、それが将来のオープンソースビッグモデルの重要性における最大の未知数要素となるでしょう。

産業アプリケーションにおいては、最初にソリューションを実装したベンダーだけが発言権を持ちます。しかし、オープンソースモデルは、クローズドソースベンダーが主張するように「オープンソースに未来はない」とは決して言えません。オープンソースの「ジャングル法則」のような競争モデルは、クローズドソースよりも制御が難しいものの、ルールを変えるような企業を生み出す可能性も高くなります。

オープンソースが業界にもたらす活力と破壊的影響が続く限り、オープンソースモデルは常に業界の重要な部分であり、これは業界大手の主観的な希望によって変わることはありません。

著者: 張永毅

転載元：発電所

編集者：王玄

関連資料

オープンソースの大型モデルLlamaは技術的な優位性を失うのでしょうか?

小さなモデルとオープンソースは、AI 開発における変数になりつつあります。

オープンソース協会の紹介

2014年に設立されたオープンソース協会（KAIYUANSHE）は、オープンソースの理念に献身的に貢献する個々のボランティアで構成されるオープンソースコミュニティであり、「貢献、合意、そして共同統治」の原則に基づき活動しています。KAIYUANSHEは、「ベンダー中立性、公益性、非営利性」の原則を堅持し、「中国を拠点とし、世界に貢献し、新時代のライフスタイルとしてオープンソースを推進する」というビジョンを掲げています。その使命は「オープンソースのガバナンス、国際的な連携、コミュニティの発展、そしてプロジェクトのインキュベーション」であり、健全で持続可能なオープンソースエコシステムの共創を目指しています。

オープンソース協会は、オープンソースを支援するコミュニティ、大学、企業、政府機関と積極的に連携しています。また、世界的なオープンソースライセンス認証組織であるOSIの中国初の会員でもあります。

2016年以降、中国オープンソースカンファレンス（COSCon）が毎年開催され、「中国オープンソース年次報告書」が継続的に発表されています。また、「中国オープンソースパイオニアリスト」と「中国オープンソースコードパワーリスト」も共同で立ち上げ、国内外で幅広い影響力を発揮しています。

618ZXW

なぜ大企業はオープンソースとクローズドソースのどちらかを選ぶのでしょうか?

関連するおすすめ記事

ランダムにおすすめされた記事

人気のタグ