|
長年にわたり、Midjourneyの多様な芸術スタイルからOpenAIが支援するDALL-E、そしてオープンソースのStable Diffusion(SD)に至るまで、テキストから画像へのモデルの生成品質と速度は継続的に向上し、迅速な理解と詳細な処理は、さまざまなモデル間の徹底的な競争の新たな方向性となっています。 2024年に入り、「二頭立て」のフェーズにあったMidjourneyとStable Diffusionは、相次いで動きを見せた。まずSD3がリリースされ、続いてMidjourney V6.1がリリースされた。しかし、人々がSD3とMidjourneyの比較に熱中していた頃、新世代の「魔王」がひっそりと誕生した。突如として現れたFLUXである。 FLUXは、キャラクター生成、特に実在の人物が登場するシーンにおいて、驚くほどリアルな結果を実現します。表情、肌の色、髪型や色といったディテールが、驚くほどリアルに再現されています。かつてはStable Diffusionの後継として高く評価されていましたが、興味深いことに、この2つは共通の起源を持っています。 FLUXの開発チームであるBlack Forest Labsの創設者であるRobin Rombach氏は、Stable Diffusionの共同開発者の一人でもあります。Stability AIを退職した後、Robin氏はBlack Forest Labsを設立し、FLUX.1モデルを発表しました。 現在、FLUX.1はPro、Dev、Schnellの3つのバージョンを提供しています。ProバージョンはAPI経由で提供されるクローズドソース版で、商用利用に適しており、最も強力なバージョンでもあります。DevバージョンはProバージョンから直接「抽出」されたオープンソース版で、非商用ライセンスです。Schnellバージョンは最も高速で合理化されたバージョンで、最大10倍の高速化が報告されています。オープンソースで、Apache 2ライセンスに基づいてライセンスされており、ローカル開発や個人利用に適しています。 この次世代のテキスト画像変換超強力なツールを、多くのユーザーが試してみたがっています!HyperAI公式サイト(hyper.ai)のチュートリアルセクションでは、FLUX [dev]のComfyUI版でLoRAトレーニングもサポートする「FLUX ComfyUI(Black Myth: Wukong LoRAトレーニング版を含む)」を公開しています。 興味のある方はぜひチェックしてみてください!私もすでに試してみましたが、SD 3やMidjourneyと遜色ない結果でした↓
さらに、ビリビリの人気アップマスターであるジャック・クイ氏も、ステップバイステップでみんなに教えるための詳細なチュートリアルを作成しました! チュートリアルアドレス: https://go.hyper.ai/trQhv 操作ビデオ: https://www.bilibili.com/video/BV1xSpKeVEeM デモ実行中 FLUX ComfyUI 実行中
HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください): https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej
|
殿下、文勝図の時代がまた変わりました!SDコアメンバーが起業し、最初のモデルであるFLUX.1がSD3やMidjourneyと熾烈な戦いを繰り広げています。
関連するおすすめ記事
-
DeepSeekが国内大型模型メーカーの闘志に火をつけ、RAGなどのコア技術が再評価されつつある。
-
量子力学100周年:物理学に革命をもたらす迅速な戦い | Nature
-
ブレーキ大手のブレンボは「ショックアブソーバー」を29億ドルで購入した。
-
3Bモデルはロボット工学の潜在能力を最大限に引き出します!コーヒーを淹れたり、服を畳んだり、7つの異なる動作モードに適応したりできます。OpenAIも投資しています。
-
ハルビン工業大学チーム: DeepSeek R1 の多言語機能の初めての総合分析!
-
ImageNet の空間インテリジェントバージョンが登場しました。Fei-Fei Li と Jia-Jun Wu のチームによって制作されました。