|
拡散モデルは高解像度画像合成の主流手法となっています。従来の拡散モデルは画像合成において大きな進歩を遂げてきましたが、高解像度に拡張すると、オブジェクトの重複や計算コストの増加といった問題に直面することがよくあります。 Megvii Technologyのオープンソース高解像度フレームワークHiDiffusionは、Resolution-Aware U-Net(RAU-Net)とImproved Shift-Window Multi-Head Self-Attention(MSW-MSA)という2つのコアコンポーネントで構成されています。画像生成の解像度を一般的な1024×1024から4096×4096に向上させるだけでなく、画像生成速度を1.5~6倍向上させ、オブジェクトの重複や高い計算負荷といった問題を効果的に解決します。 HyperAIは現在、「HiDiffusion:高品質8K画像を素早く生成」に関するチュートリアルを公開しています。このチュートリアルでは、テキストから画像への変換と画像から画像への変換の両方をサポートし、画像復元機能も備えています。コマンドは不要で、アプリのクローンを作成するだけですぐに使用できます。 公開チュートリアルアドレス: https://go.hyper.ai/yZ5K5 デモ実行中
HyperAI 限定招待リンク (コピーしてブラウザに貼り付けてください): https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej
コンテナが「リソース割り当て中」の状態が10分以上続く場合は、コンテナを停止して再起動してみてください。再起動しても問題が解決しない場合は、公式サイトのプラットフォームカスタマーサービスまでお問い合わせください。 プレビュー デモを開くと、左上隅に「テキストから画像へ」、「画像から画像へ」、「画像の修復」のオプションを含むメニュー バーが表示されます。 1. テキストから画像への生成 「テキストから画像を生成」をクリックし、肯定的なプロンプト(犬が芝生で遊んでいました。太陽が明るく輝いていました)と否定的なプロンプト(ぼやけている、醜い、重複している、顔が下手、変形している、モザイク、アーティファクト、手足が不自然)をテキストボックスに入力して、「送信」をクリックします。すぐに画像が出力されます。 2. 画像生成 「画像から画像へ」インターフェースに切り替えます。参照画像をアップロードし、肯定的なプロンプト(ジョーカー、顔のディテールが鮮明、ディテールが鮮明、落ち着いた色、8K)と否定的なプロンプト(ぼやけている、醜い、重複している、下手な描写、変形している、モザイク状)を入力します。プロンプトに基づいて、男性の写真がジョーカーに修正されるのがわかります。 3. イメージ修復 「画像を修復」インターフェースに切り替え、修復が必要な画像と修復箇所を示す画像をアップロードします。肯定的な提案(ぼろぼろの服を着て、間に合わせの槍を持った終末世界の生存者が、崩壊しつつある都市景観を覆い尽くした蔓に覆われた密林の中を慎重に進んでいる)と否定的な提案(ぼやけている、醜い、重複している、下手な描写、変形している、モザイク状になっている)を入力します。提案に従って、マークした箇所が修正されるのが確認できます。 「安定した拡散チュートリアル交換グループ」を作成しました。ぜひご参加いただき、さまざまな技術的な問題について議論し、アプリケーションの経験を共有してください。 |
新しいチュートリアル | テキストから画像への編集、画像から画像への復元、画像修復のための 3 in 1 ツールである HiDiffusion が、ワンクリックで開始できるチュートリアルで利用できるようになりました。
関連するおすすめ記事
-
AIはRNAウイルス研究における歴史的な進歩の達成に貢献しており、中山大学などの研究機関はディープラーニングモデルを使用して16万種類以上の新しいウイルスを発見しました。
-
論文募集のカウントダウン!CVPR 2025 ワークショップで「ベースモデル + X」の堅牢性の課題について議論します。
-
Jike の再設計により Mobileye が放棄され、インテリジェント運転チップ業界初の上場企業にとって状況はさらに困難になった。
-
比類なきスターたち:2000年代以降の天才たちが中国のAAA SFコンソールゲーム市場を席巻
-
大学との協働学習活動「OPEN AI 基礎教育講座」受講登録受付開始!
-
哨哨Sシューティングブレークが正式に発売!世界唯一のレンジエクステンダー付きシューティングブレークセダンの価格は159,900元から。