|
ヨーロッパの OpenAI はもうオープンではありません。 Mistral AI は「世界最高のエッジモデル」と主張するものをリリースしたが、疑問と論争に巻き込まれている。 今回はマグネットリンクのオープンモデルウェイトがないだけでなく、「常に同業他社より優れている」という主張が競合他社との比較において包括的ではないためです。 公式アカウントやCEOのページのコメント欄では、一部のネットユーザーが遠慮なく問題点を指摘した。 「なぜQwen2.5と比較しないのか?」 Mistral AI は、エッジ コンピューティングとエンド ユーザー コンピューティング向けの 2 つの新しいモデル、 Ministral 3B と 8Bをリリースしました。 発表によれば、この 2 つのモデルは、100 億未満の規模で、知識、常識、推論、関数呼び出し、効率性の面で新たな境地を開くという。 提示されたベンチマークテストでは、内部フレームワークを使用してすべてのモデルを再評価し、複数のタスクにわたって「一貫して同等のモデルよりも優れている」と主張しました。 ただし、具体的な評価結果は、自社の第 1 世代 Mistral モデル、Google の Gemma、Meta の Llama シリーズのみを比較したものです。 行方不明となっていたQwen2.5シリーズは9月19日に発売され、公式レビューではMistral 7B、Llama 3、Gemma 2とも比較されていました。 厳密に同一の条件下での比較ではありませんが、多くの開発者は相対的なデータが参考になると考えています。 StabilityAI の元 CEO である Emad Mostaque 氏も、最初の使用感から Qwen 2.5 の方が使い勝手が良く、オープンソース ライセンスもより寛容になったと述べ、より多くの人に Qwen 2.5 を試すよう勧めています。 エッジ側の小型モデルは競争が激しい。Ministral 3Bおよび8Bモデルはどちらも128kのコンテキスト長をサポートします。Ministral 8Bは独自のスタッガード・スライディング・ウィンドウ・アテンション機構を備えており、より高速でメモリ効率の高い推論を実現します。 それ以外、現時点ではさらなる技術的な詳細は明らかにされていない。 本日より、両モデルとも公式プラットフォーム上でAPIアクセスが可能です。商用ライセンスの取得については、公式チームにお問い合わせください。 なお、 8B モデルの分銅は研究用途のみであり、3B モデルの分銅は現在入手できません。 これに対して、Django フレームワークの創設者であるSimon Willison 氏は、より寛容なオープンソース ライセンスと Llama ファミリーのライブラリの高品質を考慮すると、新しい Mistral モデルに期待しにくいと書いています。 注目すべきは、Qwen2.5-7B は寛容な Apache 2.0 オープンソース ライセンスに基づいていますが、3B モデルは Mistral と同様に研究ライセンスを選択している点です。 これは、30 億規模の AI の商用化が加速しており、携帯電話などのデバイスで実行できる小型エッジ モデルの競争力が高まっていることを示しています。 ヨーロッパの OpenAI は失敗した。Mistral AI が小型のオンデバイス モデルをリリースした日は、同社の最初のモデルである Mistral 7B の発売 1 周年でもありました。 公式チームはまた、1年以内に製品ラインがいかに早く完成されたかを示すために、ティーンエイジ・ミュータント・ニンジャ・タートルズのミームを作成しました。 1 年前、Mistral AI は、最初に謎めいたマグネット リンクとオープン モデルの重みを公開し、その数日後に技術レポートを公開するというユニークなスタイルで、オープン ソース コミュニティで新たな人気を博しました。 しかし現在、この「欧州版OpenAI」は徐々にオープン性を失いつつあります。 2024年初頭、Mistral AIはMicrosoftとの提携を発表し、同時に発売されたMistral Largeモデルの重量は非公開となりました。また、オープンソースコミュニティへの義務に関するコンテンツを公式ウェブサイトからひっそりと削除しました。 この動きは同社の戦略の大きな転換とみなされ、大きな議論を巻き起こした。 オープンソース コミュニティのメンバーの中には、まず無料または低価格の製品でユーザーを引きつけ、その後高度な機能に対して料金を請求するというこのアプローチは「裏切り」であるとして、失望を表明した人もいます。 マグネットリンクのオープンウェイトを廃止した最新の Mistral AI モデルは、同社初のマルチモーダル大型モデルである Pixtral です。 これは、マルチモーダル分野にまだ慣れていないためであり、ビジネス モデルが成熟するにつれて、徐々に非オープンソースへと移行していくだろうと考える人もいます。 一部のネットユーザーは、大規模モデルの台頭により商業競争が激化するにつれ、Mistral AI が最終的にオープンソースの対極となるのは避けられないだろうと悲しみを表明している。 それでも、彼らは多くの好意を獲得したので、私はまだ彼らを応援しています。 参考リンク: |
Qwen 2.5と比較する勇気もなく、ミストラルの最強の小型モデルは論争に巻き込まれ、OpenAI Europeは開店しなくなりました。
関連するおすすめ記事
-
タオバオでアルゴリズムに取り組んだ私の経験: タオバオ画像検索の 10 年間、ビジュアル アルゴリズム テクノロジーの進化の歴史。
-
中国最強の自動車メーカーは?上位15社の上半期決算を比較:販売台数最多はSAIC、利益率はBYDがトップ、粗利益はSeresが圧倒的にリード。
-
セレスの売上高は302%急増し、変革以来初の通期黒字を達成しました!文傑M9は15万台を販売し、同社は工場買収に82億元という巨額を投資しました。
-
ウルトラマンが再びDeepSeekについて語る: 目覚めるたびにストレスを感じる。
-
彼女にキャラクターが誕生!AIとのビデオ通話はほぼ遅延なし。SequoiaとY Combinatorが投資。
-
Tianwenベースのビッグデータモデルがさらにアップグレードされ、ビデオを「見て」理解するだけでなく、小さなターゲットを素早く認識し、シーンの関係性を理解することもできるようになった。