|
近年、拡散モデルはテキストベースの画像生成タスクにおいて広く利用されています。しかし、高品質な画像生成を実現するプロセスでは、ノイズ除去のために複数の推論ステップが必要となることが多く、計算リソースのコストが明らかに増加します。 この問題に対処するため、研究者らは拡散モデルの推論プロセスを高速化する蒸留アルゴリズム、すなわち拡散センサ蒸留アルゴリズムを導入しました。現在、一般的に使用されている手法は、軌跡保存蒸留と軌跡再構成蒸留に大別されますが、どちらもパフォーマンスの著しい低下と近傍シフトの問題を抱えています。 この問題に対処するため、ByteDanceはHyper-SDと呼ばれる革新的なフレームワークを提案しました。これは、両方の手法の長所を活用し、短所を回避するものです。ノイズ除去のステップ数を削減しながら、ほぼロスレスのパフォーマンスを維持します。TSCD(Trajectory Segmented Consistency Distillation)技術により、高速かつ高品質な画像生成を実現します。 広範囲にわたる実験とユーザー調査により、Hyper-SD は SDXL と SD1.5 アーキテクチャの両方で 1 ~ 8 ステップで最先端 (SOTA) の画像生成パフォーマンスを実現することが証明されています。 「Hyper-SDリアルタイムRaw画像描画」がHyperAIスーパーニューラルチュートリアルセクションに公開されました。コマンドは不要。ワンクリックでクローンを作成するだけですぐに開始できます。 チュートリアルアドレス: デモ実行中
HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください): https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej
プレビュー
|
オンライン チュートリアル | 最先端の (SOTA) イメージをワンステップで生成: Hyper-SD ワンクリック スタート チュートリアルが利用可能になりました。
関連するおすすめ記事
-
Baidu Search × DeepSeek!統合が正式に発表され、わずか24時間以内にフルバージョンがリリースされました。実際のテストはここから開始されます。
-
国産シャシーでメルセデス・ベンツSクラスに挑戦してみたら、予想外の結果に…。
-
2024年オープンソースソサエティ年間賞
-
Meta の最新の研究: トークナイザーのないアーキテクチャ!
-
Difyは日本市場開拓後、どのようにしてグローバルなAIカバレッジを実現したのでしょうか?
-
中国の電気自動車市場は、これまで大手1社と強力な競合2社によって支配されていたが、その支配的地位は弱まりつつある。ファーウェイとリーオートの両社は衰退し、一方で重慶と杭州を拠点とするメーカーが最大のダークホースとして浮上した。