618ZXW

これはHugging Faceの直接の競合でしょうか?GitHub ModelsにはOpenAI o1/Llama 3.2などのモデルが追加され、新しい機能によりモデルの並列比較がサポートされています。

「オープンソースは、世界中のより多くの人々がAIの発展の恩恵を受けられるようにする」と、ザッカーバーグ氏はLlama 3.1のリリース時に長文の記事で述べ、オープンソースの重要性を説明した。実際、近年のAIの急速な発展に伴い、オープンソースの人気は高まり続けている。開発者のオープンソースコミュニティへの貢献は、個人の技術的姿勢を示すだけでなく、ある程度、最先端技術の探求における成果を示すものでもある。

この過程で、オープンソース プロジェクト ホスティング プラットフォームの 2 大メジャーである GitHub と Hugging Face も急速な成長を遂げました。

2023年、GitHubはユーザー数が1億人を突破し、世界最大のオープンソースコードホスティングプラットフォームになったと発表しました。GitHubがユーザー数ゼロから1億人に到達するまでには15年かかりました。一方、Hugging Faceは2か月前にユーザー数が500万人に達したと発表しましたが、これは8年かかって達成したマイルストーンです。

現在、Hugging Face は、NLP、コンピューター ビジョン、音声、時系列、生物学、強化学習などの分野を網羅する 107 万以上の事前トレーニング済みモデルと 234,000 のデータセットを共有しており、「機械学習の GitHub」として称賛されています。

急成長中のHugging Faceは、GitHubよりもユーザー数は少ないものの、大規模なモデリング機能と同等に豊富なオープンソースリソースを武器に、近年急速な発展を遂げています。そのため、ネットユーザーの間では次のような憶測が飛び交っています。AIの発展が加速するにつれ、Hugging Faceは徐々にGitHubに取って代わり、開発者にとってより人気の集まる場所になるのでしょうか?そして、より早く活動を開始し、より強力なユーザーベースを持つオープンソースプロジェクトホスティングプラットフォームであるGitHubは、どのように対応するのでしょうか?

最近終了した GitHub Universe 2024 で GitHub CEO の Thomas Dohmke 氏が発表した一連の新開発が、この疑問への答えになるかもしれません。GitHub Models が正式にオープンになり、OpenAI o1、Meta Llama 3.2、Microsoft Phi 3.5 などのモデルが追加されました。

GitHub Models は Model Hub に対抗しようとしているのでしょうか? 新しい機能が追加されます。

ご存知の通り、Hugging Faceはオープンソースモデルのグローバルハブとなっており、Spacesセクションはすぐに使える体験を提供し、開発者にとって非常に便利な環境を提供しています。具体的には、 2020年にHugging FaceはオープンAIモデル共有プラットフォーム「Model Hub」を立ち上げました。ユーザーは様々なNLPモデルをアップロード、共有、ダウンロードできるため、AIモデルの再利用と拡張性が大幅に促進され、AI開発者にとって「MLモデル版GitHub」となりつつあります。現在、このプラットフォームには1,076,375件のオープンソースモデルが登録されています(記事執筆時点)。

対照的に、GitHubはオープンソースAIモデルの統合においてやや「遅い」傾向にあり、GitHub Modelsセクションは今年8月にようやくリリースされました。当初の目標は、開発を簡素化し、AIアプリケーション開発への参入障壁を下げ、適切なツールとトレーニングがあればすべての開発者がAIエンジニアになれるようにすることでした。

3ヶ月後、GitHub Modelsは正式にオープンし、一連のアップデートとアップグレードを経て現在に至ります。開発者はプレイグラウンド、API、その他の手段を通じてAIモデルにアクセスできます。

まず、新しい機能:

  • 展開プロセスを簡素化します。Azure 運用キーを使用して、アプリケーションを開発環境から運用環境に迅速に移行します。
  • 新しいモデルプリセットでは、プロンプト、パラメーター、メッセージをタイムリーに保存できます。
  • 新しく追加されたマルチモーダル サポート機能により、運用シナリオでマルチモーダル対応モデルに画像サポートを提供できます。
  • 新しい並列比較機能が追加され、同じプロンプトに対する 2 つのモデルの出力をリアルタイムで比較できるようになりました。

次に、モデルが拡張され、OpenAI o1、Meta Llama 3.2、Microsoft Phi 3.5、Cohere Command Rシリーズ 08-2024、A21 Jamba 1.5が追加されました。既存のLlama 3.1、GPT-4o、Phi 3、Mistral Large 2モデルと合わせると、合計35のモデルが開発者に利用可能になります。同様に、GitHubはユーザーがCodespacesとVS Code開発環境で開発するためのGlideパスを提供しています。

まとめると、Hugging FaceのModel HubとGitHub Modelsはどちらも、開発者が最先端のオープンソースモデルを迅速に体験できるプラットフォームを提供しています。しかし、GitHubは現在、大手テクノロジー企業のオープンソースの基礎モデルに重点を置いており、既に自社のプラットフォーム上でオープンソース化されている他の高品質なモデルについては、まだ考慮していません。一方、Hugging Faceは、モデルの数と適用範囲の両方においてGitHubをはるかに上回っています。

研究者の研究をさらに加速させるため、 Hugging FaceとarXivがプラットフォームの障壁を「打ち破った」ことは特筆に値します。arXivページの「コード、データ、メディア」タブにあるHugging Faceボタンを有効にするだけで、ユーザーはワンクリックでHugging Faceの関連論文、モデル、データセットに直接アクセスできます。この動きは、プラットフォームのユーザー数をさらに増加させると予想されます。

GitHub から生まれたこのツールは、「ソフトウェア 2.0」時代の GitHub となるのでしょうか?

オープンソースコミュニティの「先駆者」として、GitHubはHugging Faceと比べてユーザーベースにおいて間違いなく大きな優位性を持っています。GitHub Universe 2024では、GitHubのユーザー数が1億人を超え、今年だけでも世界中の開発者がGitHub上のオープンソースリポジトリとパブリックリポジトリに10億件近くのコントリビューションを行ったことが明らかになりました。

両プラットフォームの開発の歴史にも興味深い話が満載です。

2008年に4人のプログラマー、トム・プレストン=ワーナー、クリス・ワンストラス、PJ・ハイエット、スコット・チャコンによって設立されたGitHubは、創業者たちが純粋にプログラマー出身であり、企業経営の経験が不足していたため、当初は困難に直面しました。2016年には、GitHubは複数の関係者から、プラットフォームの混乱した経営を嘆く共同苦情書を受け取りました。2年後、マイクロソフトが75億ドルでGitHubを買収し、GitHubは追加のリソースと明確な戦略的方向性を獲得し、着実な成長期を迎えました。

一方、Hugging Faceも発売される予定です。

2016年、クレメント・デラングはジュリアン・ショーモンドとトーマス・ウルフと共にHugging Faceを共同設立しました。同社は当初チャットボットに注力していましたが、当時の同分野の多くのスタートアップと同様に、なかなか軌道に乗りませんでした。しかし、マイクロソフトによるGitHub買収の翌年である2019年は、Hugging Faceにとって転機となりました。

Hugging Faceは、チャットボットのNLP(自然言語処理)機能をトレーニングするために、GitHubでTransformersライブラリをオープンソース化しました。皮肉なことに、このオープンソースプロジェクトは機械学習コミュニティで急速に人気を博し、GitHub史上最も急成長したAIプロジェクトとなりました。

Hugging Faceは2020年に、オープンAIモデル共有プラットフォーム「Model Hub」と、大規模オープンソースデータセット管理ツール「Datasets」をリリースしました。2021年には、ユーザーがStreamlitやGradoなどのツールを使用してAIモデルを展開・公開できる「Spaces」をリリースしました。

現在、Hugging Faceは最も急速に成長しているコミュニティであり、最も広く利用されている機械学習プラットフォームとなっています。当時のCEOであるクレメント・デラング氏はインタビューで、AIはソフトウェアの新たなパラダイム、すなわち「ソフトウェア2.0」であると述べました。この見解は、AI分野の著名な研究者であるアンドレイ・カルパシー氏も支持しています。

彼はかつて、従来の人間によるプログラミングは「ソフトウェア1.0」に属し、GitHubは「ソフトウェア1.0」のコードセンターとして非常に成功していると述べました。一方、「ソフトウェア2.0」の時代では、プログラミングにニューラルネットワークが使用され、この移行期にGitHubのような重量級のプラットフォームが登場するでしょう。Hugging Faceは、「ソフトウェア2.0」時代のGitHubになることを目指しています。

GitHubとHugging Faceの収益モデルの比較:名声と富の両立

1+1>2の相乗効果はGitHubで実証されています。Microsoftに買収された後、多くの開発者はGitHubがオープンソースであり続けられるかどうかについて懸念を示しました。しかし、それは事実ではありません。GitHubは開発者中心のプラットフォームであることに注力し続けています。

関連メディアの報道によると、2018年にマイクロソフトがGitHubを買収した当時、GitHubの年間経常収益(ARR)はわずか2~3億ドルでした。2022年にはGitHubのARRは10億ドルに成長し、2023年には14億ドルに達すると業界では予測されていましたが、公式の数字は公表されていません。

現在、GitHubは比較的完成度の高い収益モデルを構築しており、収益源は主にサブスクリプションプランと有料サービス、エンタープライズサービス、マーケットプレイスサービスという3つの方法に分かれています。中でも、エンタープライズサービスはGitHubの最大の収益源となっています。

Hugging Face の収益化モデルは GitHub と似ており、有料メンバーシップ、データ ホスティング、エンタープライズ サービスという 3 種類の有料サービスがあります

強力な支援を受けているGitHubとは異なり、Hugging Faceは主に外部投資に依存しており、収益を上げるために投資家からのプレッシャーに直面する可能性があります。2021年以前、Hugging Faceは収益がなく、コミュニティ運営の維持は投資家からの資金に完全に依存していました。Hugging Faceが商業化を模索し、収益化フェーズに入ったのは2021年以降です。Forbesによると、同社の2021年の収益は1,000万ドルで、現在の年間収益は3,000万ドルから5,000万ドルです。

今年7月、HuggingFaceの共同設立者兼CEOのクレメント・デラング氏はソーシャルメディア上で、同プラットフォームが収益を上げており、チームメンバーが220人になったことを祝ったと発表した。

昨年8月23日、Hugging FaceはシリーズDの資金調達ラウンドで2億3,500万ドル(現在約16億7,500万人民元)を調達し、企業価値は45億ドル(現在約320億8,800万人民元)に達しました。投資家には、Google、Amazon、Nvidia、Salesforce、AMD、Intel、IBM、Qualcommなど、まさにスター企業が多く名を連ねています。これは、業界がHugging Faceの成長ポテンシャルを高く評価していることを示唆しています。

1 つのトレンドが終わると、別のトレンドが始まります。AI 開発者が最大の勝者として浮上する可能性があります。

GitHubが年次カンファレンスを開催している間、Hugging Faceも手をこまねいていたことは特筆に値します。共同創業者のクレメント・デラング氏はソーシャルメディアで、「Enterprise Hugging Face hub」カンファレンスを10月30日(太平洋夏時間)に開催すると発表しましたが、GitHubのイベント開催日よりも遅い時間でした。そこで必然的に、Hugging Faceは今回どのような対応を取るのでしょうか?という疑問が浮かび上がります。

参考文献:

1.https://originality.ai/blog/huggingface-statistics

2.https://karpathy.medium.com/software-2-0-a64152b37c35

3.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA

4.https://mp.weixin.qq.com/s/0JNZPBCmLvRYHn4tcOTIrA

5.https://www.shidaox.com/observation/440.html

6.https://github.blog/news-insights/octoverse/octoverse-2024/