|
オリジナル Datawhale Datawhale Datawhale がそれをテストしました。 AIアプリケーション:iFlytekスマートマニュファクチャリング たった 1 枚の写真を使用して、独自のデジタル ペルソナをカスタマイズできます。 これは、大規模モデルがデジタルヒューマンの分野にもたらした最新の衝撃です。 ちょうど 2 週間前、AI Developer Talk Hefei イベントで、Datawhale の同僚の 1 人である Yu Xin がデジタル ヒューマンとして大画面に登場し、参加している開発者に歓迎のスピーチをしました。 ユー・シンはさらに若く見える!👐 わずか十数秒のこの短い動画は現場で熱い議論を巻き起こした。「デジタルヒューマン・ユー・シン」の声はあまりにも自然で、本物の人間と区別がつかないほどで、唇と体の動きの同期も非常に自然で、彼女に独特の魅力を与えている。 このハイパーヒューマノイドデジタルヒューマンテクノロジーは、iFlytek Intelligent Manufacturingによって最近リリースされました。 私たちはミニプログラムの iFlytek の「スーパー ヒューマノイド デジタル ヒューマン」機能を使用し、写真 (以下を参照) と音声録音のみを使用して、わずか数秒でこのビデオを生成しました。 「ハイパーヒューマノイドデジタルヒューマン」機能は現在完全に稼働しており、導入障壁は非常に低くなっています。それでは見てみましょう。 写真は超人的なデジタル人間を生み出す ハイパーヒューマンのデジタルヒューマンに変身するには、自分の写真をアップロードするだけです。 ここでは、Datawhale の同僚 Yuxin の写真を例として使用します (Yuxin にボーナスをあげましょう! 🍗) まず、「iFlytek Smart Creation」ミニプログラムを開き、下部の「+」をクリックして、先ほどアップロードした画像をアップロードします。 追伸:アップロードする際は、より良い結果を得るために、正面から目の高さで撮影した全身の高解像度の写真を選択するようにしてください。 次はデジタル音声の選択です。音声ライブラリから音声を選択することも、ご自身の声を再現することもできます。 iFlytek のインテリジェント オーディオ ライブラリには、あらゆる年齢層、複数の言語スタイル、さまざまな業界、さらには複数の国語をサポートする、事前に構築されたオーディオ トラックの膨大なライブラリがあります。 サウンドライブラリ内の豊富なサウンドを直接使用することも、ワンクリックで自分の声を「複製」することもできます。 この手順も非常に簡単です(下の図をご覧ください)。文章を声に出して読み上げ、音声を「Yu Xin」として保存するだけです。 音質については、後ほど動画で確認してみます。 次に、前のページに戻り、サウンドセクションで複製した「Yu Xin」を選択して、「送信」をクリックします。 わずか数秒で、Yu Xin の超人型デジタル ヒューマンが完成しました。 「数秒で構築」と言っても過言ではありません。 しかし、速度だけでは十分ではありません。業界ではよく言われているように、「計算が正しいかどうかは気にしないで、どれだけ速いかを教えてください!」 次に、生成されたデジタルヒューマンの効果をテストするためのビデオを作成します。 動画の作成もとても簡単です。まずは下の写真のように、ハイパーヒューマノイドデジタルヒューマンエフェクトを選択し、先ほど作成した「Yu Xin」を画像と音声に選択します。 次に、デジタルヒューマンに話してほしいテキストを入力します。もちろん、iFlytekのAI(Spark Copywriting Assistant)を使ってテキストを生成することもできます。 たとえば、「AI 時代の祝福メッセージ」というキーワードを入力すると、Spark Copywriting Assistant が即座にコピーを生成します。 AI時代において、叡智の光があなたの毎日を照らしますように。データの海を自由に泳ぎ、知識とイノベーションの力を得られますように。この知的に繋がる世界で、輝かしいキャリアと充実した人生を送られますように! 最後に、「ビデオを生成」をクリックして数秒待ちます。 完成品をお楽しみください: 効率性がこのように大幅に向上したにもかかわらず、ハイパーヒューマノイドのデジタルヒューマンは高いレベルの詳細さと品質を維持しています。 今年の旧正月の大晦日には、ハイパーヒューマノイドのデジタルキャラクターを使って、友人や家族に新年の挨拶をすることができます。 現在、ハイパーヒューマノイドデジタルヒューマンの応用シナリオは非常に有望です。誰でも、どんなキャラクターでも、わずか数秒でデジタルヒューマンのビデオクローンに変身させることができます。 ソーシャルメディアプラットフォームによるライブストリーミング電子商取引、文化観光の促進、あるいはこうした新しいパラダイムによって製品を一般家庭に届ける可能性など、これらはますます一般的になりつつあります。 ハイパーヒューマノイドデジタルヒューマン:大規模モデルと新たな応用パラダイムの時代へ 大規模モデルがもたらす大規模アプリケーションの時代は、テクノロジーコミュニティにおける新たなホットな話題となっています。 iFlytek Smart Creationが開発したハイパーヒューマノイドデジタルヒューマン生成技術の中核は、特にそのマルチモーダルインタラクション技術で注目を集めています。 例えば、ボディモーションの駆動において、iFlytekはこのスーパーヒューマノイド型デジタルヒューマンに大胆な技術革新をもたらしました。マルチモーダル拡散技術を応用した大規模モデル生成により、デジタルヒューマンの四肢の動きを音声コンテンツと自然に一致させ、従来のプリセットモーションの限界を打ち破りました。デジタルヒューマンの動きはより自然で滑らか、リアルで、よりリアルになっています。 <iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3696851210209411072" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FvI9nYe94fsGVNwMK42tCY5hspS HQkicwQa140tmeTH2ycc0kRPtJgJgGPOatnCTWcpXrrqIBQTqR5bRJYvIdarw%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" data-ratio="2.1621621621621623" data-w="1280" style="border-radius: 4px;" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3696851210209411072"></iframe> 表情や動作の意味的連続性に関しては、iFlytek Smart Creation は大規模モデルに基づくマルチモーダルインタラクション技術を利用して、「唇 - 表情 - 動作」にわたる意味的連続性を生成し、クロスモーダルな意味的一貫性を実現します。 iFlytekのハイパーヒューマノイドデジタルヒューマンは、作成時間を2段階に短縮し、デジタルヒューマンのカスタマイズのハードルを下げ、AIデジタルヒューマン分野での主導的地位を確立しました。 生産性を解放し、想像力を解き放ち、クリエイティブな制作をシンプルかつ効率的にし、誰もがアクセスできるようにします。 体験チャンネル:iFlytekスマートマニュファクチャリング いいね! (3件のいいね!)↓ |
iFlytek Smart Creation の実際のテスト: たった 1 枚の写真で独自のデジタル アバターをカスタマイズします。
関連するおすすめ記事
-
PLMにおける大きな進歩!上海交通大学と上海AIラボの最新の成果がNeurIPS 24に選出されました。ProSSTはタンパク質構造情報を効果的に統合します。
-
BMWは苦境に陥っている。利益は10%急落し、値下げによりブランドイメージが損なわれ、値下げを行わなかったため売上が急落し、市場価値は一夜にして400億ドルの損失となった。
-
BYDの収益は初めてテスラを上回ったが、時価総額は依然として6分の1である。
-
オンラインチュートリアル | 宿題を急いで終わらせたい小学生にとって、DeepSeekは必須アイテムでしょうか?「サーバーがビジー状態」にさよならする方法をステップバイステップで学びましょう。
-
Operatorのような強力なツールでさえ、CAPTCHAに対して脆弱です。1450元の価格は価値があったのでしょうか?最初のテストラウンドが始まりました。
-
Datawhale広報チームメンバー募集中!(全4フェーズ)