618ZXW

大人気!外灘サミットでディープフェイクでロボットを騙そうとしたけど…

外灘サミットでディープフェイクを生成したのですが、ボットを騙せませんでした...

むしろ、ほんの数秒であっという間に見つかった?!

ロボットの手にある強力な武器は、私たちが毎日使っている携帯電話のカメラです。

大人気ですよ!

ディープフェイク攻撃と防御は、外灘会議全体で最も注目された展示エリアの 1 つとなり、関連するディスカッションも外灘会議全体で最も人気のあるフォーラムとなり、会場は人でいっぱいになりました。

世間に知られているように、これほど注目を集めたのには理由があります。

最近、ディープフェイクが大きな復活を遂げており、このAI技術を使って犯された犯罪の重大さから、ネットユーザーたちはこれを「韓国のN番部屋の再来」と呼んでいる。

前述の「グローバル・ディープフェイク・ディフェンス・チャレンジ」には、ディープフェイクの脅威に対抗するため、世界26の国と地域から2,200人以上の研究者が参加しました。大会中、参加チームの一つである中国科学院自動化研究所は、AIモデルをオープンソース化し、無料で利用できるようにすることを発表し、多くのネット上で反響を呼びました。

バンドサミットでは、ディープフェイクの生成から対決までのプロセスを実際に体験し、AIが一般の人々が偽造のリスクを識別するのにどのように役立つかを確認する機会がついに生まれました。

他にはどんな詳細があるのでしょうか?他にどんなハイライトがあるのでしょうか?見てみましょう。

Ant Financialの調査

まずは、Ant Financial の超人気展示エリア「ディープフェイク攻撃と防御」を見てみましょう。

プロセス全体を通して必要なのは、固定された地点に立って、iPad で顔を撮影してもらうことだけです。

次に、既存の AI モデルによって顔が入れ替わった画像やビデオが生成されます。

ディープフェイクはロボットアームを使って、3セットの画像と動画から本物の写真を特定します。動画は非常にリアルです。さて、「私は私ではない」と証明できる人はいるでしょうか?

現場でのリアルタイムの物理データ収集のため、ロボットアームがスマートフォンを持ち、カメラを開いて写真を撮影してデータを収集し、認識操作を実行します。

わずか数秒で、ビンゴ!ロボットが正解を識別しました。

現場スタッフによれば、日常業務では、わずか3秒で識別できることも多いという。

これは、Dimensity Labs とセキュリティ ブランド ZOLOZからの技術サポートによって支えられています。

Dimensity Labsは、主に信頼できるデジタルIDに注力しており、独自の自動生体認証評価システムを開発しています。現在、市場に出回っているAndroidスマートフォンの70%がDimensity Labsで厳格なテストを受けています。Dimensity Labsは、Googleが「Android生体認証セキュリティ」に関して公式に提携している唯一のグローバルテスト機関でもあります。

後者は、アント・ファイナンシャル傘下のセキュリティ技術ブランド「ZOLOZ」で、現在、中国、インドネシア、マレーシア、フィリピンなど14の国と地域の70社以上のパートナーに、エンドツーエンドの本人確認、オンライン詐欺検出、継続的なリスク監視サービスなどの技術サービスを提供しています。

今年4月には、ディープフェイク対策製品「ZOLOZ Deeper」をリリースしました。バンドサミットでのデモンストレーションでは、実際のビジネスシナリオを披露しました。

数十万のテスト サンプル、毎月 20,000 件を超える攻撃および防御テスト、数百の偽の攻撃シナリオのシミュレーション...

AI 注釈付きのシナリオも同様に直感的でわかりやすい方法で提示されます。

大規模な AI モデルの作成プロセスには、通常、取得、ラベル付け、合成という 3 つのステップが含まれます。

最初のステップはデータ収集プロセスです。

現場には実際の環境を模擬した砂場が設けられ、ロボットアームを使って砂場内の任意の場所やシーンをリアルタイムで撮影しました。

この時点で、画像データがシステムに送信され、データ生成が始まります。

次のステップは注釈付けです。これは従来のように手動で行うのではなく、AIGD (AI 生成データ) 用の自社開発のマルチモーダル大規模モデルを使用して行います。

このモデルは、オブジェクトの検出と注釈付け、セマンティックセグメンテーション、テキストの説明、深度検出、3D モデリングなどのタスクを自動的に実行できます。

人間は主に情報の確認において補助的な役割を果たします。例えば、テキスト記述の段階では、対象物の色や形状などの詳細を識別するために人間による確認が必要です。

最後に、データ合成について説明します。その中核となる機能は制御性です。個々のオブジェクトを編集できるだけでなく、シーン全体を監視することもできます。

これにより、データ収集の必要性がなくなり、既存の制限が打ち破られ、まったく新しいデータを継続的に生成できるようになります。

実シーンのアノテーションに加え、ビデオアノテーションモジュールも搭載されています。任意のビデオから任意のフレームをキャプチャするだけで、アノテーションと合成操作を完了できます。

このエンドツーエンドの制作システムは、実際のテストによれば、同じデータ構造と規模で注釈の効率を 40% 以上向上させることができます。

インテリジェントな注釈製品に加えて、アント ファイナンシャルには 10,000 人のヒューマン注釈チームがあり、その 90% 以上が垂直の専門分野の上級注釈人材です。

データラベリングに関して言えば、現在市場で最も代表的な企業は、テクノロジー業界の注目のユニコーン企業であるScale AIです。同社は最近、約10億ドルの資金調達ラウンドを完了し、評価額は138億ドルに上昇しました。

ただし、Scale AIとは異なり、Ant Financialはデータ処理および合成サービスも提供しています。

たとえば、一部の企業のプライベート領域や垂直分野では、大量のデータが公開されておらず、十分に調査されていません。

Ant Financial は、さまざまなシナリオとテクノロジーにおける長年の経験を組み合わせ、企業の「オンサイト」データ サービス実現を支援するだけでなく、交通、政府関係、金融などの垂直シナリオでのデータの一般化をターゲットにして、より高品質なデータを統合することもできます。

さて、上記のディープフェイク攻撃と防御、そしてインテリジェントラベリングは、今回のイベントにおけるアント・ファイナンシャルの最も代表的な展示です。

注目すべきは、これら 2 つの問題が現在熱く議論され、業界で最も注目を集めているということです。

AIアプリケーションの急増に伴い、データ捏造の問題にどう対処すべきでしょうか?大規模モデルが急速に導入される中で、高品質なデータの不足という問題にどう対処すべきでしょうか?

大規模モデルの時代が応用段階に入った今、より多くのリスクと問題が露呈し、企業に多くの課題をもたらしています。

長年にわたり業界に深く関わってきたアント・ファイナンシャルも、今回独自のソリューションを持ち込んだ。

これは外灘サミットで、最も話題になったこの 2 つの製品の中に隠されていました。

同社のビジネス戦略全体を要約すると、 「データのための AI から AI のためのデータへ」となります。

データのためのAIからAIのためのデータへ

「データのためのAI」から「AIのためのデータ」への移行とは何でしょうか?この質問に答えるには、まず業界全体の現状を把握する必要があります。

AIはモデル駆動型からデータ駆動型へと進化し、デジタルトランスフォーメーションの深化に伴い、企業の生産・運用は本質的にデータの流れとなっています。テクノロジーとシナリオ、AIとデータは、かつてないほど完璧に融合しています。ビジネスシナリオは効率向上のためにAIを必要とし、AIを強化するためには高品質なデータを最大限に活用する必要があります。

一方では、 AIを活用してデータの価値を徹底的に探求し、データ分析や判断を行うデータ向けAIがあります。

リスク管理を例にとると、これはすべての企業が事業運営や生産を行う際に直面するシナリオです。

アント・ファイナンシャルは、AIを活用した意思決定型リスク管理アルゴリズムモデルを構築しました。このモデルは、ビジネスデータ、司法データ、財務報告データ、サプライチェーンデータ、請求書・税務データ、世論データなどのデータを統合し、企業の効率的かつ正確な意思決定を支援します。

従来、手作業によるリスク管理には多くの人員が必要であり、経営ニーズの把握と迅速な意思決定に大きな課題がありました。しかし現在では、AIを意思決定支援ツールとして活用することで、経験の浅い運用担当者でも、最も複雑なシナリオにも対応できるようになりました。

例えば、アント・ファイナンシャルと中国鉄道建設総公司の協力では、「産業データ+AIモデル」に基づく産業リスク管理プラットフォームを共同で構築し、産業チェーンにおける顧客アクセスの効率を少なくとも50%向上させました。

一方、「AIのためのデータ」は、高品質なデータがAIモデルのトレーニングの基盤であることを強調しています。データサービス、データ処理、データラベリングを統合したAI主導のソリューションは、大量の生の非構造化データを企業向けの高品質な構造化データに変換するプロセスを加速します。

さらに、トレーニング、製造、使用中の大規模モデルの安全性、制御性、信頼性を確保するための AntSky のような大規模モデル セキュリティ製品もあります。

Ant Financial が ABC という 3 つの主要な事業セグメントを形成していることがわかりました。

まず、クラウド サービス (Cloud+) は、企業がデジタル「クラウド移行」段階に入り、より強力なテクノロジー エンジンを構築するのに役立ちます。

2つ目の部分はAIサービス(AI+)で、AI技術を活用してリスク管理、マーケティングなどのシナリオの効率を再構築・向上し、企業がビッグデータモデルの時代に競争上の優位性を確立できるよう支援します。

3番目の部分はブロックチェーンサービス(Blockchain+)であり、テクノロジーを使用して業界の信頼を構築し、デジタルコラボレーションの効率を向上させ、データ資産の循環を加速します。

アント・ファイナンシャルにとって、ABCの「A」は非常に重要です。これは、今回発表されたアント・ファイナンシャルの事業構想が「 AI for DataからData for AIへ」であることを明確に示しており、以下の3つの特徴を備えています。

産業、産業、そしてさらに産業。AIを活用して真の産業価値を創造し、現実世界の課題を解決する。これは、大規模モデルの応用においても最も重要な命題です。

産業界にはどのような AI が必要でしょうか?

大型モデルが進化するにつれて、人々の大型モデルに対する認識も変化してきました。

例えば、最近の業界の課題や反省を踏まえると、画像や動画の生成モデルが頻繁に議論されています。人々の関心はもはやその効果の驚異性ではなく、過度にリアルな結果がもたらす潜在的な危険性に集まっています。「高品質データの不足を緩和する」はずだったデータ合成は、Nature誌の表紙記事で「Garbage in, Garbage out(ゴミを入れればゴミが出る)」と題され、データ合成の増加が言語モデルの崩壊につながる可能性を示唆し、この新たな業界トレンドに水を差す結果となりました…。

スケーリング則に関する議論ですが、産業用途で使用される大規模モデルの適切なパラメータ数はどれくらいでしょうか?パラメータの数が増えれば増えるほどモデルのパフォーマンスが向上するというのは本当でしょうか?

これらの問題は、さらに別の懸念を引き起こしました。それは、大規模なモデルには本当にバブルが存在するのか、ということです。

これがなぜこのような反省を促したのかは、理解しにくいことではありません。

大規模モデル技術の発展と応用の深化に伴い、大規模モデル機能の限界が徐々に認識されるようになりました。モデルパラメータの数はもはやモデル機能の中核的な指標ではなく、高いモデル性能を確保するには高品質なデータの流入が不可欠です。

一方、大規模モデルはより深い応用分野へと進出しています。産業界におけるAIへの需要はもはや単なる技術追求にとどまらず、現実世界の課題解決こそが大規模モデルを評価する唯一の基準となっています。

これにより、シナリオに多くの課題が生じます。

データの問題を例に挙げると、現在市場に出回っている大規模モデルのほとんどは、インターネット上で公開されているデータセットに基づいています。データセットは数が多く多様であるにもかかわらず、その質と量は保証されておらず、その多くは「ダーティ」データです。

本格的なプロフェッショナル アプリケーションの場合、まず、高品質な業界データの多くは公開されていないか、企業内部にあるため、統一されたスケジュールと管理のためのシステムが必要であり、一部の非構造化データを変換する必要があります。次に、大量の公開データは、トレーニングに使用できるレベルに達するためにエンジニアリング レベルのクリーニングとラベル付けが必要です。

したがって、大規模モデルがさまざまな業界でどのように実装されているかを見るとき、大規模モデルのパフォーマンスのデモンストレーションだけを見るのではなく、大規模モデルが業界とどのように深く統合されているかを見る必要があります。

業界に長期投資を行ってきた企業は、応用シナリオの面で当然優位性があり、AI 機能と影響力を業界に統合する可能性が最も高くなります。

Ant Financial はその一例です。

- 以上-