618ZXW

オープンソースの大型モデルLlamaは技術的な優位性を失うのでしょうか?

オープンソース協会開源社

以下の記事は、楊光氏が執筆した『China Information Weekly』からの引用です。

昨夜、Metaはこれまでで最も強力なオープンソースモデルであるLlama 3.1 405Bのリリースを発表しました。このモデルは128Kトークンのコンテキスト長をサポートし、16,000台以上のH100 GPUで15兆トークンの学習を行いました。Metaがこの規模のLlamaモデルを学習したのは今回が初めてです。Metaは、新たにアップグレードされたLlama 3.1 70Bおよび8Bモデルもリリースしました。研究者による150以上のベンチマークセットでのLlama 3.1 405Bの評価では、GPT-4o、Claude 3.5 Sonnet、Gemini Ultraなどのトップモデルに匹敵することが示されています。

MetaのCEO、マーク・ザッカーバーグ氏は、Llama 3.1モデルのリリースを発表し、オープンソースAIの重要性について長文の記事を執筆しました。同氏は、これらのモデルは高性能でオープン、かつカスタマイズ性に優れ、幅広いエコシステムによってサポートされていると述べました。「私たちは、最先端のオープンソースAIモデルであるLlama 3.1 405Bをリリースしました。クローズドソースモデルと比較して大幅に優れたパフォーマンスに加え、405Bモデルのオープン性は、より小規模なモデルの微調整や抽出に最適な選択肢となるでしょう。」

ザッカーバーグ氏は、LinuxオペレーティングシステムがクローズドソースのUnixに取って代わった例を挙げ、オープン性、変更可能性、そして費用対効果といった利点を持つオープンソースAIがクローズドソースモデルを凌駕し、業界の主流となるだろうと示唆した。「将来の機会を考える際には、今日の主要なテクノロジー企業や科学研究のほとんどがオープンソースソフトウェア上に構築されていることを忘れないでください。私たちが共に投資すれば、次世代の企業や研究はオープンソースの人工知能を活用するでしょう。」

ザッカーバーグ氏は、世界中の開発者、CEO、役員と話をすると、通常、複数の視点を聞くことになる、と述べた。

まず、ユーザーは独自のモデルをトレーニングし、微調整し、抽出する必要があります。各ユーザーはモデルのサイズに関して独自のニーズを持っており、特定のデータに基づいてモデルのトレーニングまたは微調整が行われることを期待しています。デバイス上のタスクや分類タスクでは小さなモデルで十分ですが、より複雑なタスクにはより大きなモデルが必要です。「今後は最先端のLlamaモデルを活用し、独自のデータでトレーニングを継続し、ニーズに最適なモデルサイズに抽出することができます。その際、私たちや他の誰にもデータを公開することはありません」とザッカーバーグ氏は述べています。

第二に、ユーザーは自らの運命をコントロールする必要があり、クローズドソースのモデルベンダーによって制限されることを望んでいません。多くのユーザーは、自身で実行・制御できないモデルに依存したくありません。クローズドソースのモデルプロバイダーがモデルを変更したり、利用規約を変更したり、さらにはサービスを完全に停止したりすることを望んでいません。また、ユーザーは、モデルへの排他的アクセスが1つのクラウドプラットフォームに限定されることも望んでいません。「オープンソースは、幅広い企業のエコシステムにおいて互換性のあるツールチェーンを持つことを可能にし、それら間の移行を容易にします。」

第三に、ユーザーはデータセキュリティを保護する必要があります。多くのユーザーは、機密データを処理する際に保護する必要があり、クローズドソースモデルのクラウドAPIを介して送信することはできません。また、クローズドソースモデルプロバイダーにデータを処理させることを単純に信頼できないユーザーもいます。「オープンソースは、モデルをどこでも実行できるようにすることで、これらの問題を解決します。オープンソースソフトウェアは開発プロセスの透明性が高いため、一般的に安全であると考えられています。」

4つ目に、ユーザーは効率的で手頃な価格のモデルを必要としています。「開発者は、ユーザー向けタスクでもオフライン推論タスクでも、GPT-4oなどのクローズドソースモデルを使用する場合の約半分のコストで、Llama 3.1 405B推論を自社のインフラストラクチャで実行できます。」

第五に、ユーザーは長期的な標準となり得るエコシステムへの投資を望んでいます。多くのユーザーは、オープンソース開発がクローズドソースモデルよりも速く進歩していることを認識しており、長期的なメリットを最大限に提供するアーキテクチャ上にシステムを構築したいと考えています。

ザッカーバーグ氏は、オープンソースAIには多くの利点があると考えています。開発者にとっては、カスタマイズ可能なモデル、データセキュリティの管理、コスト削減、そして長期的なエコシステムの構築が可能になります。メタ視点では、技術のロックインを回避し、イノベーションを促進し、オープンソースのエコシステムを確立します。大規模モデル開発の観点からは、オープンソースモデルは透明性が高く、幅広いレビューが可能で、セキュリティの向上にも役立つため、技術の進歩を促進することができます。

Meta は、オープンソース AI の開発を継続的に推進し、コミュニティやパートナーと協力してより広範なエコシステムを構築することに尽力しています。

MetaはなぜオープンソースAIに注力しているのでしょうか?Llamaをオープンソース化することで、その技術的優位性は失われるのでしょうか?「オープンソースこそが最良の開発スタックであり、長期的に持続可能なプラットフォームだと信じています」とザッカーバーグ氏は述べました。まず、Llamaが最良の技術にアクセスし、長期的にクローズドソースのエコシステムに閉じ込められないようにするためには、効率性の向上、シリコンの最適化、その他の統合を含む、ツールの完全なエコシステムへと発展させる必要があります。「もしLlamaを使用している企業が私たちだけだったら、このエコシステムは発展せず、クローズドソース版のUnixを上回るパフォーマンスを発揮することはできなかったでしょう。」

第二に、人工知能は非常に競争が激しいため、特定のモデルをオープンソース化しても、その時点では次善のモデルよりも優位に立つことはできません。「Llamaが業界標準となるには、競争力、効率性、そしてオープン性を維持しながら、世代を超えて継続的な開発を続ける必要があります。」

さらに、Metaとクローズドソースのモデルプロバイダーとの重要な違いは、AIモデルへのアクセスを販売することがLlamaのビジネスモデルではないことです。「つまり、Llamaを一般公開しても、当社の収益、持続可能性、研究投資能力が低下することはありません。これはクローズドソースプロバイダーには当てはまりません。」

最後に、Metaは長年にわたりオープンソースプロジェクトに取り組んでおり、成功を収めてきました。「Open Computeプロジェクトを通じて、サーバー、ネットワーク、データセンターの設計を公開し、サプライチェーン全体で設計を標準化することで、数十億ドルものコストを削減してきました。PyTorchやReactといった主要ツールをオープンソース化することで、エコシステムのイノベーションの恩恵も受けています。この長期的なアプローチは、私たちにとって常に成果を上げています。」

著者:ヤン・グアン

転載元:中国情報週刊

編集:ドゥアン・ヤンシン

関連資料

GNU 一般公衆利用許諾書から始めて、中国のオープンソースを世界に公開しましょう。

小さなモデルとオープンソースは、AI 開発における変数になりつつあります。

オープンソース協会の紹介

2014年に設立されたオープンソース協会(KAIYUANSHE)は、オープンソースの理念に献身的に貢献する個々のボランティアで構成されるオープンソースコミュニティであり、「貢献、合意、そして共同統治」の原則に基づき活動しています。KAIYUANSHEは、「ベンダー中立性、公益性、非営利性」の原則を堅持し、「中国を拠点とし、世界に貢献し、新時代のライフスタイルとしてオープンソースを推進する」というビジョンを掲げています。その使命は「オープンソースのガバナンス、国際的な連携、コミュニティの発展、そしてプロジェクトのインキュベーション」であり、健全で持続可能なオープンソースエコシステムの共創を目指しています。

オープンソース協会は、オープンソースを支援するコミュニティ、大学、企業、政府機関と積極的に連携しています。また、世界的なオープンソースライセンス認証組織であるOSIの中国初の会員でもあります。

2016年以降、中国オープンソースカンファレンス(COSCon)が毎年開催され、「中国オープンソース年次報告書」が継続的に発表されています。また、「中国オープンソースパイオニアリスト」と「中国オープンソースコードパワーリスト」も共同で立ち上げ、国内外で幅広い影響力を発揮しています。