|
近年、拡散モデルはテキストベースの画像生成タスクにおいて広く利用されています。しかし、高品質な画像生成を実現するプロセスでは、ノイズ除去のために複数の推論ステップが必要となることが多く、計算リソースのコストが明らかに増加します。 この問題に対処するため、研究者らは拡散モデルの推論プロセスを高速化する蒸留アルゴリズム、すなわち拡散センサ蒸留アルゴリズムを導入しました。現在、一般的に使用されている手法は、軌跡保存蒸留と軌跡再構成蒸留に大別されますが、どちらもパフォーマンスの著しい低下と近傍シフトの問題を抱えています。 この問題に対処するため、ByteDanceはHyper-SDと呼ばれる革新的なフレームワークを提案しました。これは、両方の手法の長所を活用し、短所を回避するものです。ノイズ除去のステップ数を削減しながら、ほぼロスレスのパフォーマンスを維持します。TSCD(Trajectory Segmented Consistency Distillation)技術により、高速かつ高品質な画像生成を実現します。 広範囲にわたる実験とユーザー調査により、Hyper-SD は SDXL と SD1.5 アーキテクチャの両方で 1 ~ 8 ステップで最先端 (SOTA) の画像生成パフォーマンスを実現することが証明されています。 「Hyper-SDリアルタイムRaw画像描画」がHyperAIスーパーニューラルチュートリアルセクションに公開されました。コマンドは不要。ワンクリックでクローンを作成するだけですぐに開始できます。 チュートリアルアドレス: デモ実行中
HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください): https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej
プレビュー
|