|
Apple初のロボット(実験版)は実はデスクランプ? 最近、Apple がロボットを開発する計画があるとの報道が頻繁になされているが、そのロボットの具体的なデザインや形状は未だに決まっていない。 Apple の新しい論文によると、これらのものはロボットのようには見えず、どこにでも存在する可能性があるそうです。 Appleはデモ用のランプロボットをリリースし、RedditやXなどのプラットフォームでヒットとなった。 このデスクランプは非常に柔軟性が高く、機械的な動きから解放され、その動作を通じて「感情」を表現することさえできます。 例えば、次のデモンストレーションでは、その行動から強いステルス性が感じられます。まず周囲を見回し、誰も見ていない隙にブロックを倒します。そして、成功した後には、勝ち誇ったように首を振ります。 また、人々にお辞儀をしたり、体をこすったり、さまざまなジェスチャーに応じて照明を手伝ったりと、非常に従順なように見えるときもあります。 いつでも、さまざまなシナリオに同行できます。 これは、表情豊かな動きをする非ヒューマノイドロボットに関する Apple の最新の研究です。 機能的な動作を実行するために A 地点から B 地点までしか移動できないロボット (右) と比較すると、このロボット (左) はより親しみやすいように見えます。 ほら、遠くの紙に光を当てると、紙に届くように頭を伸ばしますが、届かない場合は「イライラして下を向きます」。 飼い主は野菜を刻みながら音楽を聴いていたのですが、犬もすっかりリズムに乗り始めました。 この一連の行動を見たネットユーザーたちは「これはピクサーが現実になったか?」と大騒ぎした。 それは冷たく、生気のないロボットではありません。 Apple の新しい調査を詳しく見てみましょう。 Appleのロボットにはいくつかの「感情」がある。この研究の核となる考え方は、ロボットはA地点からB地点に移動するなどの機能的な動作を行うだけでなく、意図、注意、態度、感情などの内部状態を動作を通じて伝えることができ、それによってより自然な人間とコンピュータの相互作用を実現できるというものです。 この目的のために、研究チームは、非ヒューマノイドロボットのための機能的かつ表現力豊かな移動モードを設計することを目的とした、 ELEGNTと呼ばれる革新的なフレームワークを提案しました。 技術的なレベルでは、研究チームはロボットの動きをマルコフ決定プロセス (MDP) としてモデル化しました。これには、機能的効用(F) と表現的効用(E) という 2 つの主要コンポーネントが含まれます。 機能的ユーティリティはロボットが特定のタスク目的を完了するように駆動し、表現的ユーティリティはロボットが動きを通じて内部状態を伝えることを可能にします。 システムの全体的な目標は、これら 2 つの効用値の加重合計 (F + γE) を最適化することです。ここで、γ は表現された効用の重みを表します。 表現力豊かな動きを実現するため、研究チームはキネシックスやプロクセミクスを含む一連の設計プリミティブを開発しました。 キネシックス プリミティブには、空間次元と時間次元の両方の機能が含まれています。 空間特性の面では、ロボットは比喩的なジェスチャーを用いて様々な状態を表現することができます。例えば、ランプの形をしたロボットは、「うなずく」や「首を振る」といった動作で態度を表すことができます。時間特性の面では、ロボットは速度を調整したり、一時停止したり、体を揺らしたりすることで、態度や感情を伝えることができます。 近接学プリミティブは、静的カテゴリと動的カテゴリの両方を含む空間距離を管理することで、ロボットとその環境および人々の関係を表現する方法に重点を置いています。 静的ポジショニングとは、ロボットを物体や人に対して相対的に配置することで、注意や意図を伝えることです。例えば、ロボットは物体を「注視」し、光や投影によってその物体を強調することで、注目していることを示すことができます。 ダイナミクスは、動きを通して態度や意図を表現します。物体に近づいたり離れたりすることは、ロボットの姿勢を反映し、物体間の方向転換は注意の変化を示すことができます。 クリエイション ピクサー テーブルランプ 検証実際には、研究チームはテーブルランプに似たロボットを設計しており、その外観はピクサーの画期的な作品であるいたずら好きな跳ねるランプ「Luxo Jr.」からインスピレーションを得たものである。 このロボットは、再構成された 6 自由度ロボット アーム、LED が埋め込まれた 3D プリントのプラスチック ランプ ヘッド、レーザー プロジェクター、および内蔵カメラで構成されています。 また、下向きの外部カメラと、ユーザーの声を聞いたり話しかけたりするための音声システムも備えています。 設計フレームワークの有効性を評価するために、研究チームはユーザー調査を実施し、21 人の参加者を募集して、純粋に機能的なアクションと表現的なアクションの追加の 2 つのシナリオでインタラクション効果を比較しました。 実験では、機能的なタスク(照明の調整など)や社会的タスク(社交的な会話など)を含む 6 つの異なるシナリオが対象となりました。 各タスクには 2 つのバージョンのビデオが用意されました。1 つは機能的な動作のみを示し、もう 1 つは機能的な動作と表現的な動作の両方を含みます。 この調査では多次元評価システムが使用され、参加者は人間化、知覚された知性、知覚された感情/性格、インタラクティブな関与、つながりの感覚、使用意欲の 6 つの側面について採点されました。 定量的な結果では、表現動作を行うロボットは、純粋に機能的な動作を行うバージョンよりも大幅に高いスコアを獲得したことが示されました (平均スコアはそれぞれ 56.16 と 28.77)。 2 つのバージョン間の違いは、認識される性格、人間化の度合い、参加レベルの点で最も顕著であり、社会的志向のタスクでは、表現アクションによってもたらされる利点がより顕著になります。 さらに、参加者の年齢、ロボット工学の経験の有無、プレゼンテーションデザインの経験など、個人的な背景もスコアに影響します。 定性的な結果から、参加者は一般的に、表情豊かな動きをするロボットの方がより生き生きとして興味深く、擬人化しやすいと考えており、「ペット」や「子供」に例えられることが多いことが明らかになりました。 この研究では、表現行為の価値はさまざまなタスクによって異なり、社会的タスクではより顕著な影響があることも判明した。 より良いインタラクションを実現するために、ロボットの動きを他のインタラクション様式(音や光など)と調整する必要があります。 アップルの新たな研究は広く賞賛されているが、汎用ロボットは依然として必要だと主張して批判する声も多く聞かれる。 移動可能である必要があり、またアームと手も必要です。家具のすべてにコア機能を追加するのはコスト効率がよくありません。 さて、あなたはこのようなロボットが好きですか?ロボットはどんな形であるべきだと思いますか? 論文リンク: https://arxiv.org/pdf/2501.12493 参考リンク: [1]https://www.reddit.com/r/robo...\_gets\_it\_robots\_are\_going\_to\_be\_everywhere/ [2]https://x.com/uavster/status/... |
Appleがデスクランプをロボットに変身させました!動きを通して感情を表現し、ロボットのインタラクションを再定義します。
関連するおすすめ記事
-
張俊林:OpenAI o1の価値と意義、そして強化学習のスケーリング則
-
すごいですね!アメリカのAI博士課程の学生がトップカンファレンスでそれぞれ10本の論文を発表しています。
-
OpenAIが突如o3マインドチェーンを公開!ネットユーザー:DeepSeekに感謝しよう。
-
新型モデルYにはこれらの新しいデザイン要素が採用されており、7人乗りバージョンも正式に確認されています。
-
NIO初の900Vモデルが生産ラインから出荷されました!Model Yに対抗するこのモデルは、冷蔵庫、テレビ、大型ソファを搭載し、事前販売価格は22万元です。
-
マルチモーダル長文ドキュメントの新たなベンチマークが登場!理解、推論、ローカリゼーションなど20以上のタスクを網羅し、GPT-4oは辛うじて合格しました。