|
図02だけを見るのではなく、国産ロボットの最新成果を公開し、その実力を披露しています! 北京市宜荘に人型ロボット「ジム」がある。 ここのロボットは、 1時間で6km走れるタイプのトレッドミルでトレーニングする初めてのロボットです。 これは単なるウォーミングアップです。走った後には、まだ階段を登らなければなりません。 屋外では専用のロボットトラックも設置され、摂氏30度の暑さの中でも作業が継続できるようにした。 芝生や斜面などの難しい地形が時々あります。 今年4月に国内デビューを果たした、純電動のフルサイズヒューマノイドロボット「天宮」。北京刺繍知能ロボットイノベーションセンターが開発しました。 登場当初、Tiangong の主な特徴は擬人化された走行でしたが、わずか数か月でその機能は大幅に向上しました。 天宮は、上に示したようにトレッドミルで走ったり、複雑な屋外地形を歩いたりするだけでなく、中国語と英語で会話したり、人間の指示に従って物体をつかんだりできる大型モデルで強化されました。 2024年の世界ロボット会議の開催が迫っており、QuantumBitは、これらの機能よりも「多く」を統合した「天宮」の進化版が会議で発表されることを事前に把握していた。 さらに、時期が来ると、職人たちは「衣装」を着替え、手をつけて、主要な関節をアップグレードします。 進化版天宮の性能について、モーションコントロール担当の郭易傑氏に話を聞いた。 大型モデルで支えられた全身42自由度アップグレードされた Tiangong の機能パラメータは次のとおりです。 以前と比較すると、下の表の通り、身長は163cm、体重は43kgから56kgに増加しました。 完全な自由度は 42 自由度に増加し、片腕の 3 自由度と比較して 7 自由度に増加し、首にも 3 自由度が加わりました。 △初期の天宮機能パラメータこれまで天宮には「手」がなかったが、今回は手が搭載されている。片手は600g、6自由度、触覚センサーの精度は0.3N以内、一本指の握力は1kgを超える。 さらに、Tiangong には4 つの全景双眼構造化光 3D カメラと高精度の 6 次元力センサーが搭載されており、360 度の環境認識が可能になります。 天宮は環境を感知することで複雑な地形に適応し、草原、砂地、丘陵、砂利道を移動し、30cmの地形差にも対応できます。 走行時の安定性も向上し、最高速度は時速6kmに達します。 また、天宮のもう一つの大きなアップグレードは、大型モデルを搭載し、マルチモーダルな運用能力を備えていることです。 中国語と英語の両方をサポートし、人間と話したり対話したりできるようになりました。 人間の指示に従ってアイテムを掴むこともできます。 [残念ながら、ここにビデオを挿入することはできません...ただし、QuantumBit WeChat公式アカウントで視聴できます〜] これらはハイライトの一部に過ぎません。世界ロボット会議では、さらに多くの展示やサプライズが予定されています。 天宮が初登場した当初は、擬人化された走行能力が最大の特徴でした。感覚インタラクションを組み込んだ現在の進化版から判断すると、天宮は具現化されたインテリジェントエージェントの形態を初めて形成したと言えるでしょう。 具体化されたインテリジェントな計画、意思決定、タスク実行の研究も、Tiangong の背後にあるチームの現在の焦点です。 具現化されたインテリジェントエージェントの作成研究チームは、具現化された知能に基づいて、技術的な実装の面で天宮の視覚認識能力を向上させることに重点を置いてきました。 以前、天宮は「盲目」の状態で歩行し、足の裏で地面を確かめる必要がありました。今では、視覚に基づいて予測し、足を上げるなどの行動をとることで、大きな地形の違いに対応できるようになりました。 具体的な方法としては、強化学習(状態記憶に基づく予測強化模倣学習)に基づいた運動技能学習法を開発しました。 QuantumBit によって以前に導入されたように、この方法は、従来の方法の高い安定性の利点と、強力な一般化の利点および強化学習の環境からの独立性の利点を組み合わせたものです。 これは、強化学習によって生じる位置決め精度の低さの問題と、モデル予測制御方式の非構造化環境への適応性の低さの問題の両方を解決します。 天宮のモーションコントロール部門の責任者である郭一傑氏は、チームが以前トレーニング中に、一部のネットワークは実際の操作中にセンサードリフトの影響を受けやすく、不安定な姿勢を示すことがあることを発見したため、この方法を提案したとQuantumBitに明らかにした。 Tiangong の最初のリリース後、チームはその後数か月にわたるトレーニング中に Tiangong にさらに多くの過去の状態記憶を追加し、現在の状態と環境の地形を推定できるようにして、より優れた一般化結果を達成しました。 郭易傑氏はまた、具現化された知能の現在の課題は「アクション」タスクの計画と実行の問題に対処することだと述べた。 タスクの多様性と複雑さの両面において、人間の日常業務や生活におけるほとんどのタスクをカバーできます。より多くの種類のタスクをこなし、脳がこのように協力することで、より複雑で長期的なタスクを達成できるようになります。 彼は、複雑なタスク計画を実装するためのいくつかの技術的なアプローチを共有しました。 テスラロボットと同様に、主なアプローチはデータを収集し、そのデータを用いて教師あり学習を行い、比較的単純で固定されたシナリオでロボットが自動行動を実行できるように訓練することです。この方法は迅速に結果が得られますが、汎化能力はやや低いです。 もう一つのアプローチは、シミュレーション環境における強化学習トレーニングです。これは、環境内での継続的な試行錯誤によって自律的に学習するものです。この手法の主な課題は、この学習をシミュレーション環境から現実世界の物理シナリオにどのように移行させるかということです。シミュレーションと現実世界のシナリオには、知覚から具体的な物理的相互作用に至るまで、大きな違いがあります。 もう 1 つのアプローチは、大規模なモデルを使用していくつかのタスク ポイントを直接出力し、従来の動作計画を使用してこれらのタスクを実行することです。 Tiangong R&D チームの解決策はさまざまな方法を統合することであり、次のステップはメタスキル ライブラリを作成することです。 現段階では、ロボットのスキルセットを拡張する必要があると考えています。これらの手法はそれぞれ異なるタスクシナリオの解決に使用できます。そのため、スキルセット内の各スキルはそれぞれ異なる方法で実装される可能性があります。 家庭用ロボットのよくある問題を解決するQuantumBit が以前紹介した Tiangong の背後にある会社についてお話ししましょう。 北京エンボス加工知能ロボットイノベーションセンター(以下、イノベーションセンター)は、旧称北京ヒューマノイドロボットイノベーションセンターで、昨年11月に設立されました。小米科技(Xiaomi Robotics)、UBTECH Robotics、北京京成電機(Beijing Jingcheng Electromechanical)、易荘ロボット(Yizhuang Robotics)などが共同で設立しました。 彼らの目標は、国内のロボット産業における単なる車輪の再発明というプロセスを避け、具現化された知能ロボットの主要な共通問題を解決することです。 イノベーションセンターは一流の科学者やエンジニアを集め、イノベーションセンター専門家委員会と北京ヒューマノイドロボット産業連盟の設立を主導してきました。 イノベーションセンターの専門委員会は、中国科学院院士の喬紅氏が委員長を務め、総合研究所の朱松春所長、人工知能研究院の黄鉄軍会長、中国情報通信研究院の主任エンジニアの魏然氏が副委員長を務めている。 イノベーションセンターは今年4月、具現化されたインテリジェントハードウェアのオープンソースプラットフォームである「天宮」汎用ロボットマザープラットフォームをリリースした。 「天宮」プラットフォームは、ソフトウェアとハードウェアの機能モジュールを柔軟に拡張でき、一連のオープンインターフェースを提供しています。研究機関やロボット関連企業は、「天宮」親プラットフォームのソフトウェアとハードウェア機能に基づいて二次開発を行うことができます。 当時、彼らは大規模モデルを駆動源とする汎用的な身体性知能プラットフォームの探求に注力することを示唆していました。現在、多機能身体性知能プラットフォーム「Kaiwu」が徐々に登場し、鋭意開発が進められています。 「Kaiwu」プラットフォームは、具現化インテリジェンスの大規模モデルとフレームワークに焦点を当て、主要なマルチモーダル方法、具現化インテリジェンスシミュレーションアプリケーション、およびツールチェーンシステム全体の構築に注力しています。 チームは「物事を開く」ことに焦点を当て、70億を超えるパラメータを持つ大規模な視覚言語マルチモーダルモデルのトレーニングと最適化をサポートする大規模な具体化されたインテリジェンスデータセットを構築しており、ロボットが中国語のインタラクション、自由形式の質問への回答、シーンの視覚的理解、具体化された操作などの機能を実現できるようにしています。 計画では、2025年末までに200万の高品質データポイントを公開する予定です。 とはいえ、最近、ヒューマノイドロボットの分野では多くの新たな開発が行われています。 UBTECHは、ヒューマノイドロボットがすでにJK工場で稼働していることを明らかにした。テスラの公式画像では、オプティマスがバッテリーを選別するために工場に入ったことが確認されている。OpenAI搭載ロボット「Figure 02」はBMWで稼働を開始している… 「天宮」とこれら他のロボットは同じ道を辿っておらず、主に具現化された知能の共通の問題を解決しているが、それでも手作業の運命からは逃れられなかった。 現在、物品の移動や仕分けといった反復的で単調な作業や、鉱山や建設現場といった危険な状況での検査や捜索救助活動など、いくつかのシナリオで予備的なデータ収集試験が行われていることが分かっている。 2024年世界ロボット会議は8月21日、北京経済技術開発区で開幕します。進化した「天宮」ロボットファミリーを心待ちにしているファンの皆様、ぜひブックマークしてください!イノベーションセンターには「天宮」ロボットファミリー全機種を展示する素晴らしいブースが設置されるほか、サブフォーラムも開催される予定です。 もう一つなぜロボットをトレッドミルに乗せるのでしょう? 推測してみてください(ドージ)。 A: より高いバランス感覚が求められるほか、トレッドミルでは速度を制御できるため、より正確で客観的なテストが可能になります。ロボット走行実験には広いスペースが必要ですが、トレッドミルではスペースを節約できます。 |
このロボットは私の散歩の相棒になりました!複雑な屋外の地形も楽々とこなし、「ジム」でランニングもできます。
関連するおすすめ記事
-
Google は新しいコードの 25% を AI を使用して生成しており、Prompt プロジェクトに熟練したプログラマーの需要が高まっています。
-
DeepSeek-R1 を上回るパフォーマンス!Google の Gemini 2.0 シリーズから新しいモデルがリリースされ、いずれも大型モデル分野でトップ 10 にランクインしました。
-
NewOne Technologyのワンフレーム制作向け3つの主要製品アップデート:コンテンツ制作の未来トレンドをリード
-
ボトルネックを突破!北京航空航天大学のチューリッヒ工科大学などの研究者らは、拡散モデルを初めて1ビットに完全量子化し、28倍のストレージ節約と52.7倍の効率向上を達成しました。
-
Li Feifei 氏と Wu Jiajun 氏のチームは、具体化されたインテリジェントな意思決定能力の評価ベンチマークを発表し、O1-Preview がトップにランクされました。
-
OpenAI が緊急に新機能を追加: ChatGPT に Deep Search が追加され、30 分後に 10,000 語の継続的な思考を実証し、「人類最後のテスト」のチャートでトップに立った。