618ZXW

オンライン チュートリアル | 最先端の (SOTA) イメージをワンステップで生成: Hyper-SD ワンクリック スタート チュートリアルが利用可能になりました。

近年、拡散モデルはテキストベースの画像生成タスクにおいて広く利用されています。しかし、高品質な画像生成を実現するプロセスでは、ノイズ除去のために複数の推論ステップが必要となることが多く、計算リソースのコストが明らかに増加します。

この問題に対処するため、研究者らは拡散モデルの推論プロセスを高速化する蒸留アルゴリズム、すなわち拡散センサ蒸留アルゴリズムを導入しました。現在、一般的に使用されている手法は、軌跡保存蒸留と軌跡再構成蒸留に大別されますが、どちらもパフォーマンスの著しい低下と近傍シフトの問題を抱えています。

この問題に対処するため、ByteDanceはHyper-SDと呼ばれる革新的なフレームワークを提案しました。これは、両方の手法の長所を活用し、短所を回避するものです。ノイズ除去のステップ数を削減しながら、ほぼロスレスのパフォーマンスを維持します。TSCD(Trajectory Segmented Consistency Distillation)技術により、高速かつ高品質な画像生成を実現します。

広範囲にわたる実験とユーザー調査により、Hyper-SD は SDXL と SD1.5 アーキテクチャの両方で 1 ~ 8 ステップで最先端 (SOTA) の画像生成パフォーマンスを実現することが証明されています。

「Hyper-SDリアルタイムRaw画像描画」がHyperAIスーパーニューラルチュートリアルセクションに公開されました。コマンドは不要。ワンクリックでクローンを作成するだけですぐに開始できます。

チュートリアルアドレス:
https://go.hyper.ai/bQ3fh

デモ実行中

  1. hyper.ai にログインし、「チュートリアル」ページで「Hyper-SD による Raw 画像のリアルタイム描画」を選択し、「このチュートリアルをオンラインで実行」をクリックします。

  2. ページがリダイレクトされたら、右上隅の「複製」をクリックして、チュートリアルを独自のコンテナーに複製します。
  3. 右下にある「次へ: コンピューティング能力の選択」をクリックします。
  4. ページがリダイレクトされたら、「NVIDIA RTX 4090」と「PyTorch」のイメージを選択し、「次へ:レビュー」をクリックしてください。下記の招待リンクから新規登録された方には、4時間分のRTX 4090トレーニングと5時間分のCPUトレーニングを無料でプレゼントいたします。

HyperAI 限定招待リンク (コピーしてブラウザに直接貼り付けてください):

https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej

  1. すべて正しいことを確認したら、「続行」をクリックし、リソースの割り当てをお待ちください。最初のクローン作成には約1分かかる場合があります。ステータスが「実行中」に変わったら、「APIアドレス」の横にあるジャンプ矢印をクリックしてデモページに移動してください。APIアドレスアクセス機能を使用する前に、実名認証を完了する必要がありますのでご注意ください。


プレビュー

  1. デモを開いたら、描画領域に図形を描き、「プロンプト」(例:「海の上の灯台」)を入力し、「実行」をクリックするだけで画像が生成されます。

  2. さまざまなストロークを追加し続けると、新しいストロークに基づいて画像がリアルタイムで変化するのを確認できます。