|
長年にわたり、Midjourneyの多様な芸術スタイルからOpenAIが支援するDALL-E、そしてオープンソースのStable Diffusion(SD)に至るまで、テキストから画像へのモデルの生成品質と速度は継続的に向上し、迅速な理解と詳細な処理は、さまざまなモデル間の徹底的な競争の新たな方向性となっています。 2024年に入り、「二頭立て」のフェーズにあったMidjourneyとStable Diffusionは、相次いで動きを見せた。まずSD3がリリースされ、続いてMidjourney V6.1がリリースされた。しかし、人々がSD3とMidjourneyの比較に熱中していた頃、新世代の「魔王」がひっそりと誕生した。突如として現れたFLUXである。 FLUXは、キャラクター生成、特に実在の人物が登場するシーンにおいて、驚くほどリアルな結果を実現します。表情、肌の色、髪型や色といったディテールが、驚くほどリアルに再現されています。かつてはStable Diffusionの後継として高く評価されていましたが、興味深いことに、この2つは共通の起源を持っています。 FLUXの開発チームであるBlack Forest Labsの創設者であるRobin Rombach氏は、Stable Diffusionの共同開発者の一人でもあります。Stability AIを退職した後、Robin氏はBlack Forest Labsを設立し、FLUX.1モデルを発表しました。 現在、FLUX.1はPro、Dev、Schnellの3つのバージョンを提供しています。ProバージョンはAPI経由で提供されるクローズドソース版で、商用利用に適しており、最も強力なバージョンでもあります。DevバージョンはProバージョンから直接「抽出」されたオープンソース版で、非商用ライセンスです。Schnellバージョンは最も高速で合理化されたバージョンで、最大10倍の高速化が報告されています。オープンソースで、Apache 2ライセンスに基づいてライセンスされており、ローカル開発や個人利用に適しています。 この次世代のテキスト画像変換超強力なツールを、多くのユーザーが試してみたがっています!HyperAI公式サイト(hyper.ai)のチュートリアルセクションでは、FLUX [dev]のComfyUI版でLoRAトレーニングもサポートする「FLUX ComfyUI(Black Myth: Wukong LoRAトレーニング版を含む)」を公開しています。 興味のある方はぜひチェックしてみてください!私もすでに試してみましたが、SD 3やMidjourneyと遜色ない結果でした↓
さらに、ビリビリの人気アップマスターであるジャック・クイ氏も、ステップバイステップでみんなに教えるための詳細なチュートリアルを作成しました! チュートリアルアドレス: https://go.hyper.ai/trQhv 操作ビデオ: https://www.bilibili.com/video/BV1xSpKeVEeM デモ実行中 FLUX ComfyUI 実行中
HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください): https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej
|
殿下、文勝図の時代がまた変わりました!SDコアメンバーが起業し、最初のモデルであるFLUX.1がSD3やMidjourneyと熾烈な戦いを繰り広げています。
関連するおすすめ記事
-
医薬品開発会社 Cellaire は、NVIDIA と提携し、最大 100% の成功率で強化学習を使用して標的分子を最適化しています。
-
OpenAIの元CTOは自身のビジネスを立ち上げるために7億元を調達したと報じられており、彼の採用戦略は当初、元雇用主から優秀な人材を引き抜くことだった。
-
「AI + バイオメディシン」の絶好の機会を捉え、2024 年の最も注目すべき破壊的な成果を振り返ります。
-
CCFプログラマーカンファレンスの全スケジュールが公開されました。ぜひご登録の上、ダリでご参加ください!
-
テスラ サイバートラック:マスク氏が生産停止を命令?
-
清華大学 | 104 ページの「DeepSeek 初心者からエキスパートまで」は、誰にとっても必須の AI ハンドブックです。