618ZXW

謎の「レッサーパンダ」モデルが一夜にして話題に:ランキングでFluxとMidjourneyを上回る

一夜にして「red_pa​​nda」 (レッサーパンダ)という謎のグラフィックモデルが大人気に!

テキストレンダリングの分野で頂点に立った彼は、FluxやMidjourneyといったトップモデルを足元で圧倒した。

ELOスコアはFlux 1.1 Proより100ポイント以上高く、勝率は79%と高く、7秒ごとに画像を生成できます。生成された結果は以下の通りです。

それはどういう意味ですか?ネットユーザーが言うように、この男は飛び級しているんです!

これは Flux 1 Schnell から Flux 1.1 Pro への同じ飛躍です。

信じられないほど強力であることに加え、red_pa​​nda が未だに所有者不明のままであるという事実は多くの好奇心をかき立て、さまざまな憶測を呼んでいます。

  • 製品の品質が非常に高いことから、伝説的な Midjourney V7 か中型の Stable Diffusion 3.5 である可能性が非常に高いです。
  • これは OpenAI の DALL-E 4 である可能性があります。Anthropic の元従業員が画像のファイル拡張子に OpenAI を見つけたためです。
  • また、未発表のベータ版で「Pandragon」という類似の名前が発見されたことから、Mistral AI の新しいモデルである可能性もあります。
  • あるいは、Recraft のテキストベースのグラフィック モデルが Panda Warrior をデフォルトのベクター ヒントとして使用していたため、これが原因である可能性もあります。
  • ...

一部の人は、この製品は中国のメーカーによって製造されたのではないかと推測していることも言及しておく価値がある。

でもね、「赤」と「パンダ」を組み合わせたこのロゴを見ると、中国風味が強すぎるんだよ。

さまざまな意見が飛び交う中、不可解なことに、あるエンジニアの名前が挙がり、ネットユーザーからは次のようなコメントが寄せられた。

@felix_red_pa​​ndaさん、あなたですか?

笑、それはあなたのプロフィール写真と名前がとても似ているからです!

アリーナパフォーマンス

red_pa​​ndaは本当にそんなに強力なのでしょうか?QuantumBitがテストします。

なお、red_pa​​nda は最近登場したばかりなので、現在はアリーナでのみ体験できます。

ルールは簡単です。2 人の匿名モデルがランダムに選択されて競争し、ユーザーは、最も気に入っていて、プロンプトに最も合致すると思われる画像を選択するだけです。

以下では、キャプチャした red_pa​​nda を直接表示し、他のモデルの同じ問題と比較して、その効果を直感的に確認します。

レベル1: SD 3 中 (√) VS red_pa​​nda

まるで発掘されたばかりのように、精巧に詳細に表現され、リアルな質感を持つ古代の遺物の 3D レンダリング。

レベル2: red_pa​​nda VS SD 3.5 ラージ (√)

フライングバットレス、ステンドグラスの窓、鐘楼を備えた精巧なゴシック様式の大聖堂。

レベル3: red_pa​​nda VS Flux.1 [開発] (√)

モダンなオフィスで、ファイナンシャル アドバイザーが若いカップルと投資戦略について話し合っており、財務計画と長期的な資産管理に重点を置いている画像。

レベル4: red_pa​​nda (√) VS neptune_next

南極クルーズ船のポスター。

レベル5: red_pa​​nda (√) VS Flux.1 [シュネル]

エレガントな曲線デザインと「Essence of Elegance」と書かれた華やかな花柄のラベルが付いた、アールヌーボー風のビンテージ香水瓶が、3D 製品レンダリングとして作成されました。

トライアル後、5つのゲームの結果だけから判断すると、謎のモデルred_pa​​ndaは期待されたほどの圧倒的勝利を収めることはできませんでした。

ただし、個人的な美的嗜好によるものである可能性もあります。

興味のある方はぜひ試してみて、red_pa​​ndaとランダムにマッチングする幸運な人が誰なのか見てみましょう。(サンプル数を増やすコツがありますよ、dogeさん!)

ネットユーザー:中国製?

さて、ここで同じ疑問が生じます。red_pa​​nda はどこから来たのでしょうか?

ほとんどの人の第一反応は中国です。その理由は極めて単純です。第一に、非常に中国風に見えるからです。第二に、中国は現在ビデオ生成で急速に追いついているため、テキストから画像へのモデルを副業として作成するのが普通です。

この名前以上に中国らしいものはほとんどありません...

Kuaishou、ByteDance、Minimax などを挙げると、これらの企業が AI ビデオで優位に立っている様子を見ると、生成型人工知能ですでに豊富な経験を持つ企業の中国モデルのコードネームである可能性が高いことがわかります。

国内大手メーカーのほか、 Midjourney V7からも声が上がった。

Midjourneyは8月1日にバージョン6.1をリリースしましたが、公式発表ではバージョン7をテスト中とのこと。そのため、Midjourneyが予定より早く秘密裏にテストしていたのではないかと推測する声が多く上がっています。(匿名アリーナでのテストは、お馴染みの手法です。)

これは、Stability AIが先週リリースしたモデルの一つである中規模のStable Diffusion 3.5ではないかと推測する声もある。このモデルは25億個のパラメータを持ち、改良されたMMDiT-Xアーキテクチャと学習手法を採用しており、0.25メガピクセルから2メガピクセルの解像度の画像を生成できる。

彼はアリーナで様子を見るために別のペルソナを使用しているだけなのでしょうか?

さらに、アントロピック社の元従業員から比較的信頼性の高い推測が出ています。「Dalle 4 = レッサーパンダ」。

彼が提供した証拠は次のとおりです。DALL-E によって生成された画像には、関連する文字列を含む名前が付いています。

しかし、一部のネットユーザーは、パンダはインデックス作成の目的で単にデータをランダムに挿入しているだけかもしれないと反論している。

OpenAI はもはや DALL-E を開発する必要はなく、GPT-4o で十分であり、その命名規則は OpenAI のスタイルと一致していないと主張する人もいます。

OpenAI のほかに、フランスのオープンソース モデル企業 Mistral AI もリストに載っていますが、名前が似ているというだけの理由で、これはかなり無理があります。

今月初め、同社が画像生成機能やウェブ検索機能などを備えた「Pandragon」と呼ばれる新モデルをテストしているとの報道が浮上した。

ということは、まだ登場していないのはこのテストモデルなのかもしれません。

しかし、当時、Pandragon の画像生成機能は Black Forest Labs の Flux によって実現される可能性があることも明らかになりました。

このことから、「red_pa​​nda」は Flux から派生したのではないかという噂が生まれました。

わあ、もしこれが本当なら、彼は自分自身を打ち負かしたということになりますか?(ドージ)

ちなみに、記事執筆時点では red_pa​​nda が依然としてトップの座を維持しているものの、次点との差は徐々に縮まっているようです。

引き続き観察し、誰かがそれを主張するのを待ちましょう。