|
一夜にして「red_panda」 (レッサーパンダ)という謎のグラフィックモデルが大人気に! テキストレンダリングの分野で頂点に立った彼は、FluxやMidjourneyといったトップモデルを足元で圧倒した。 ELOスコアはFlux 1.1 Proより100ポイント以上高く、勝率は79%と高く、7秒ごとに画像を生成できます。生成された結果は以下の通りです。 それはどういう意味ですか?ネットユーザーが言うように、この男は飛び級しているんです! これは Flux 1 Schnell から Flux 1.1 Pro への同じ飛躍です。 信じられないほど強力であることに加え、red_panda が未だに所有者不明のままであるという事実は多くの好奇心をかき立て、さまざまな憶測を呼んでいます。
一部の人は、この製品は中国のメーカーによって製造されたのではないかと推測していることも言及しておく価値がある。 でもね、「赤」と「パンダ」を組み合わせたこのロゴを見ると、中国風味が強すぎるんだよ。 さまざまな意見が飛び交う中、不可解なことに、あるエンジニアの名前が挙がり、ネットユーザーからは次のようなコメントが寄せられた。 @felix_red_pandaさん、あなたですか? 笑、それはあなたのプロフィール写真と名前がとても似ているからです! アリーナパフォーマンスred_pandaは本当にそんなに強力なのでしょうか?QuantumBitがテストします。 なお、red_panda は最近登場したばかりなので、現在はアリーナでのみ体験できます。 ルールは簡単です。2 人の匿名モデルがランダムに選択されて競争し、ユーザーは、最も気に入っていて、プロンプトに最も合致すると思われる画像を選択するだけです。 以下では、キャプチャした red_panda を直接表示し、他のモデルの同じ問題と比較して、その効果を直感的に確認します。 レベル1: SD 3 中 (√) VS red_panda まるで発掘されたばかりのように、精巧に詳細に表現され、リアルな質感を持つ古代の遺物の 3D レンダリング。 レベル2: red_panda VS SD 3.5 ラージ (√) フライングバットレス、ステンドグラスの窓、鐘楼を備えた精巧なゴシック様式の大聖堂。 レベル3: red_panda VS Flux.1 [開発] (√) モダンなオフィスで、ファイナンシャル アドバイザーが若いカップルと投資戦略について話し合っており、財務計画と長期的な資産管理に重点を置いている画像。 レベル4: red_panda (√) VS neptune_next 南極クルーズ船のポスター。 レベル5: red_panda (√) VS Flux.1 [シュネル] エレガントな曲線デザインと「Essence of Elegance」と書かれた華やかな花柄のラベルが付いた、アールヌーボー風のビンテージ香水瓶が、3D 製品レンダリングとして作成されました。 トライアル後、5つのゲームの結果だけから判断すると、謎のモデルred_pandaは期待されたほどの圧倒的勝利を収めることはできませんでした。 ただし、個人的な美的嗜好によるものである可能性もあります。 興味のある方はぜひ試してみて、red_pandaとランダムにマッチングする幸運な人が誰なのか見てみましょう。(サンプル数を増やすコツがありますよ、dogeさん!) ネットユーザー:中国製?さて、ここで同じ疑問が生じます。red_panda はどこから来たのでしょうか? ほとんどの人の第一反応は中国です。その理由は極めて単純です。第一に、非常に中国風に見えるからです。第二に、中国は現在ビデオ生成で急速に追いついているため、テキストから画像へのモデルを副業として作成するのが普通です。 この名前以上に中国らしいものはほとんどありません... Kuaishou、ByteDance、Minimax などを挙げると、これらの企業が AI ビデオで優位に立っている様子を見ると、生成型人工知能ですでに豊富な経験を持つ企業の中国モデルのコードネームである可能性が高いことがわかります。 国内大手メーカーのほか、 Midjourney V7からも声が上がった。 Midjourneyは8月1日にバージョン6.1をリリースしましたが、公式発表ではバージョン7をテスト中とのこと。そのため、Midjourneyが予定より早く秘密裏にテストしていたのではないかと推測する声が多く上がっています。(匿名アリーナでのテストは、お馴染みの手法です。) これは、Stability AIが先週リリースしたモデルの一つである中規模のStable Diffusion 3.5ではないかと推測する声もある。このモデルは25億個のパラメータを持ち、改良されたMMDiT-Xアーキテクチャと学習手法を採用しており、0.25メガピクセルから2メガピクセルの解像度の画像を生成できる。 彼はアリーナで様子を見るために別のペルソナを使用しているだけなのでしょうか? さらに、アントロピック社の元従業員から比較的信頼性の高い推測が出ています。「Dalle 4 = レッサーパンダ」。 彼が提供した証拠は次のとおりです。DALL-E によって生成された画像には、関連する文字列を含む名前が付いています。 しかし、一部のネットユーザーは、パンダはインデックス作成の目的で単にデータをランダムに挿入しているだけかもしれないと反論している。 OpenAI はもはや DALL-E を開発する必要はなく、GPT-4o で十分であり、その命名規則は OpenAI のスタイルと一致していないと主張する人もいます。 OpenAI のほかに、フランスのオープンソース モデル企業 Mistral AI もリストに載っていますが、名前が似ているというだけの理由で、これはかなり無理があります。 今月初め、同社が画像生成機能やウェブ検索機能などを備えた「Pandragon」と呼ばれる新モデルをテストしているとの報道が浮上した。 ということは、まだ登場していないのはこのテストモデルなのかもしれません。 しかし、当時、Pandragon の画像生成機能は Black Forest Labs の Flux によって実現される可能性があることも明らかになりました。 このことから、「red_panda」は Flux から派生したのではないかという噂が生まれました。 わあ、もしこれが本当なら、彼は自分自身を打ち負かしたということになりますか?(ドージ) ちなみに、記事執筆時点では red_panda が依然としてトップの座を維持しているものの、次点との差は徐々に縮まっているようです。 引き続き観察し、誰かがそれを主張するのを待ちましょう。 |
謎の「レッサーパンダ」モデルが一夜にして話題に:ランキングでFluxとMidjourneyを上回る
関連するおすすめ記事
-
たった一つの場所を46人が争うシャオミの自動車工場では、春節期間中も見学ツアーを提供しており、予約は満席で、「春節の旅行ラッシュ」のようだ。
-
ACL 2024に選出されました!Wang Xiang率いるUSTCチームは、タンパク質データとテキスト情報のクロスモーダル解釈を可能にするタンパク質テキスト生成フレームワークProtT3を提案しています。
-
Li Mu: ビジネスの世界での 1 年は、現実世界での 3 年と同じくらいの感じがします。
-
AWS は自動車パートナーと協力し、ソフトウェア定義車両の変革を推進します。
-
デューク大学は PepPrCLIP を使用して「治療不可能」な癌の課題を克服し、新たな癌治療法の開発につながる可能性を秘めています。
-
1日あたりのトークンが320倍に増加、MaaSが業界モデルを席巻、Volcano EngineがGenAIからMaaS加速をリード | 大規模商用化2024