618ZXW

卓球AIロボットが人間に勝利!フォアハンドとバックハンドをシームレスに切り替え、ネットボールやハイロブも打ち返せる。プロのコーチによると、中級者レベルに到達したとのこと。

パリオリンピックの卓球団体戦が佳境を迎えており、グーグルのロボットが参加を申し込んだ。

人間レベルの競技パフォーマンスを達成した初のロボットエージェントがリリースされました!

ほら、気づかないうちにプロのコーチを1ポイント差で破ったんだ!

フォアハンドとバックハンドの素早い切り替え、連続攻撃も楽々!

ロングボール、ハイボール、ネットボールなど、予想外の戦術にも冷静に対応できる。

実際のテストでは、ロボットはさまざまなプレイヤーのスタイルにリアルタイムで適応し、最終的に初心者との対戦ではすべて勝利し、中級者との対戦でも55%の勝率を達成しました。

受け取れ、小さなピンポンボール!

このロボットと対戦したアメリカの卓球選手、バーニー・J・リードは「期待を上回る出来だった。このロボットは中級レベルに到達した」と高く評価した。

そのパフォーマンスを見たネットユーザーらは「買える?欲しい!」とコメントした。

敵に遭遇しても容易に対処できる。

卓球は、高度な体力、戦略、技術が求められるスポーツであり、習得するには何年ものトレーニングが必要になることも少なくありません。

そのため、チェスや囲碁などの純粋に戦略的なゲームとは異なり、卓球は、高速移動、リアルタイムの正確な制御、戦略的意思決定、システム設計など、ロボットの総合的な能力をテストするための重要なベンチマークになります。

たとえば、ロボットはボールのさまざまな着地地点に素早く移動する必要があります。明らかに境界外にあるボールに直面した場合、ロボットはボールをキャッチしないことを選択する必要があります。

チームは、初心者、中級者、上級者以上を含む、さまざまなスキルレベルの卓球選手 29 名をトーナメントに出場させました。

人間とロボットは、標準的な卓球のルールに従って3試合を戦いました。(ただし、ロボットはサーブができなかったため、試合全体を通して人間がサーブを担当しました。)

これに先立ち、卓球ロボットに関する同様の研究は行われてきました。Googleのロボットが特別なのは、これまで見たことのない人間と、徹底的な競争を繰り広げることができる点です。

人間のあらゆるプレイスタイルに素早く適応できます。

例えば、この出場者を見てください。試合開始直後、ロボットは明らかに適応過程にあり、人間が9対2でロボットに勝利しました。

しかし次のゲームでは、ロボットは明らかに相手のスタイルに慣れ、スコアを僅差に抑えました。両者は互角の戦いを見せました。

最終的に、ロボットはすべての初心者対戦ですべての対戦相手に勝利し、中級者に対しては 55% の勝率を達成しました。

このロボットはまだ上級プレイヤーに勝つことはできませんが、人間からのフィードバックを見ると、誰もがロボットと遊んで満足していることがわかります。

小さなピンポンボールをどうやって落とすのでしょうか?

方法を紹介する前に、卓球ロボットのハードウェア構成を見てみましょう。

本体には、スイス製の6自由度ABB 1100ロボットアームが採用されており、2つのFesto製リニアガイドに取り付けられ、平面内での移動を可能にしています。横方向ガイドの長さは4メートル、縦方向ガイドの長さは2メートルです。

ロボットアームには、3Dプリントされたラケットハンドルと、短いピンプルラバーで覆われたラケットが装備されています。

鄧熙少年はどうやって卓球を学んだのでしょうか?

要約すると、強化学習模倣学習を組み合わせたハイブリッドトレーニング方法が使用されました。

チームは、エージェントが低レベル スキル ライブラリ (LLC) と高レベル コントローラ (HLC) で構成される、階層化されモジュール化された戦略アーキテクチャを設計しました。

LLCは、フォアハンド、バックハンド、サーブといった特定の卓球スキルを実行するように訓練された、一連の特殊な戦略です。これらのLLCはCNNアーキテクチャを採用し、シミュレーション環境において進化的ポリシーアルゴリズムを用いて訓練されます。

トレーニング プロセスでは、シミュレートされた環境と実際の環境間の一貫性を確保するために、現実世界から収集されたボールの状態データセットを使用しました。

HLC は、入ってくるボールごとに最も適した LLC を選択する責任を負います。

これには、フォアハンドまたはバックハンドを選択するためのスタイル戦略、入ってくるボールのスピンの種類を識別するためのスピン分類子、各 LLC の能力を説明する LLC スキル記述子、および現在の状況に基づいて候補 LLC を絞り込むための一連のヒューリスティック戦略など、いくつかのコンポーネントが含まれます。

HLC は、オンライン学習 LLC の設定を使用して、敵の特性に適応し、シミュレーションと現実のギャップを埋めます。

具体的には、チームはまず少量の人間の競争データを収集し、初期のタスク条件を設定し、次に強化学習を使用してシミュレートされた環境でエージェントをトレーニングし、最後にサンプルなしでポリシーを現実世界に展開しました。

このシミュレーションでは、MuJoCo物理エンジンを使用して、空気抵抗やマグヌス効果を含むボールとロボットの力学を正確にシミュレートします。また、トップスピンの「補正」機能も搭載されており、シミュレーション中にラケットのパラメータを切り替えることで、現実世界におけるトップスピンとバックスピンの効果をシミュレートします。

エージェントと人間が継続的に戦闘を行うと、より多くのトレーニング タスク条件が生成され、トレーニングと展開のプロセスを繰り返すことができます。

ロボットのスキルが向上し、競技がより複雑になっても、ロボットは現実世界のタスク条件に根ざした行動を続けます。データを収集した後、ロボットは自身の欠点を特定し、シミュレーション環境での継続的なトレーニングを通じてこれらの欠点を補うことができます。

このようにして、シミュレーションと現実を組み合わせた循環的なプロセスで、ロボットのスキルを自動的に反復して改善することができます。

さらに、このロボットは、対戦相手の行動やプレースタイルを追跡して、対戦相手がテーブルのどちら側にボールを打ち返す傾向があるかなど、さまざまな対戦相手に適応することができます。

これにより、さまざまなテクニックを試し、成功率を監視し、戦略をリアルタイムで調整することができます。

人間と対戦する実験で、研究チームはロボットの弱点も発見した。それは、バックスピンボールの処理が苦手だということだ。

ボールの回転の推定に基づいて、ロボットの成功率のグラフが作成された。その結果、バックスピンのボールに直面すると、成功率が大幅に低下することが示された。

研究者らによると、ロボットはテーブルに近い低い軌道のボールを扱うのに苦労しており、衝突を避けるのが難しく、またボールの回転の種類をリアルタイムで判断するのにも限界があるという。

Googleが卓球ロボットを開発するのは今回が初めてではない。

Googleは以前から卓球をするロボットの研究を始めました。チームは他にも数多くの関連研究プロジェクトを進めています。

たとえば、Google の以前の i-Sim2Real 研究では、訓練されたロボットが人間とボールで遊び、地面に触れることなく最大 340 回ボールを打つことができました。これは、4 分以上連続して遊ぶことに相当します。

他のチームも、次のような機能を備えた卓球ロボットを開発しました。

日本代表チームやチャイニーズ・タイペイチームなどのチームも、オリンピック選手のトレーニングにロボットを使用しています。

これと Google が最近リリースしたロボットの違いは何かと疑問に思う人もいるでしょう。

一部のネットユーザーは次のように説明している。

Google の最新の焦点は、事前にプログラムされたアルゴリズムではなく、ビデオ入力を通じて動作する AI エージェントにあります。

それで、彼らが我が国の代表チームと対戦するのをいつ見ることができるのでしょうか?(Doge)

プロジェクトのホームページ: https://sites.google.com/view..._source&utm_medium&utm_campaign&utm_content&pli=1

参考リンク: [1]https://x.com/GoogleDeepMind/... [2]https://x.com/arankomatsuzaki... [3]https://x.com/lgraesser3/stat... [4]https://www.reddit.com/r/sing...\_deepminds\_aipowered\_robot\_plays\_table/ [5]https://www.youtube.com/watch...