|
近年、拡散モデルはテキストベースの画像生成タスクにおいて広く利用されています。しかし、高品質な画像生成を実現するプロセスでは、ノイズ除去のために複数の推論ステップが必要となることが多く、計算リソースのコストが明らかに増加します。 この問題に対処するため、研究者らは拡散モデルの推論プロセスを高速化する蒸留アルゴリズム、すなわち拡散センサ蒸留アルゴリズムを導入しました。現在、一般的に使用されている手法は、軌跡保存蒸留と軌跡再構成蒸留に大別されますが、どちらもパフォーマンスの著しい低下と近傍シフトの問題を抱えています。 この問題に対処するため、ByteDanceはHyper-SDと呼ばれる革新的なフレームワークを提案しました。これは、両方の手法の長所を活用し、短所を回避するものです。ノイズ除去のステップ数を削減しながら、ほぼロスレスのパフォーマンスを維持します。TSCD(Trajectory Segmented Consistency Distillation)技術により、高速かつ高品質な画像生成を実現します。 広範囲にわたる実験とユーザー調査により、Hyper-SD は SDXL と SD1.5 アーキテクチャの両方で 1 ~ 8 ステップで最先端 (SOTA) の画像生成パフォーマンスを実現することが証明されています。 「Hyper-SDリアルタイムRaw画像描画」がHyperAIスーパーニューラルチュートリアルセクションに公開されました。コマンドは不要。ワンクリックでクローンを作成するだけですぐに開始できます。 チュートリアルアドレス: デモ実行中
HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください): https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej
プレビュー
|
オンライン チュートリアル | 最先端の (SOTA) イメージをワンステップで生成: Hyper-SD ワンクリック スタート チュートリアルが利用可能になりました。
関連するおすすめ記事
-
大規模モデルは独自の言語理解を持つ!MITの論文が大規模モデルの「思考プロセス」を解明 | ICML 24
-
Jike 001 と 007 は強化されたスマート機能により急速にアップグレードされ、幹部たちは熱意にあふれている一方、ストリーマーはコメントを無効にしている。
-
ハンヴォンFF690高精度電子血圧計、コロトコフ音再生機能搭載発売:Tレベルコンピューティングパワーチップ+AI高精度聴診
-
成都の女子たちがAIのプロセスを書き換えた方法
-
DeepSeekは本日、3つの新しいリポジトリソースをリリースしました。最適化された並列戦略の開発には、Liang Wenfeng氏自身が参加しました。
-
世界初の AI 搭載ストリーミング音楽アプリが登場! 中国製。