618ZXW

オープンソースイノベーションがロボット工学の未来を照らす!GOSIM CHINA 2024「Embodied Intelligence」特別フォーラムでエキサイティングな発表が発表!

オープンソース協会開源社

以下の記事は、GOSIM が執筆した GOSIM オープンソースイノベーションフォーラムからのものです。

10月17日から18日にかけて、GOSIMオープンソースイノベーションフォーラムが主催し、CSDNが主催するGOSIM CHINA 2024が北京で開催されます。GOSIMオープンソースイベントとしては3回目となる今回のカンファレンスでは、海外から60名以上のオープンソース専門家を招き、世界をリードするテクノロジー企業、トップ大学、そして優れたオープンソースコミュニティから100名を超える技術専門家、オープンソースプロジェクトリーダー、オープンソースエコシステムのリーダーが一堂に会しました。1,000名を超える開発者やオープンソース愛好家と共に、北京に集結し、世界のオープンソース技術の革新と応用の新たな波に貢献します。

GOSIM CHINA 2024は、国際性、コミュニティ、そして強力なインタラクティブ性を特徴としています。テーマは、AIモデルとインフラストラクチャ、身体化された知能、次世代インターネット、次世代メディア、Rustプログラミング言語、そしてアプリ開発という6つの注目技術を中心に展開されます。2つの基調講演、6つのテーマ別フォーラム、6つのワークショップ、2つのハッカソンなど、多彩なアクティビティが用意され、技術開発のトレンドの最前線に焦点を当て、オープンソース技術の応用とイノベーションを探求しました。

AIの普及が進むにつれ、ロボットの知能レベルは急速に向上しています。6つのテーマ別フォーラムの中で、「エンボディド・インテリジェンス」セッションは大きな注目を集めました。2日間にわたるフォーラムには、綿密に準備された技術的知見を持つ14名の上級技術専門家が集まり、エンボディド・インテリジェンスの現状と未来について、課題と機会について議論しました。

特別フォーラムには、OpenCV創設者のゲイリー・ブラッドスキー氏、Embodied AI Foundationエグゼクティブディレクターのゲルマン・ロス氏、清華大学コンピュータサイエンス学科教授の劉華平氏、Realman Intelligent Technology共同創設者のアレン・シュー氏、Roboraction.AI CEOのユー・ホアン氏など、この分野の世界トップクラスの専門家や学者が招かれ、最先端のトピックについて議論し、産学研連携を強化し、技術成果の変革と応用を促進しました。これは、将来の技術革新の基盤を構築し、産業の発展と長期的な社会経済発展を促進することを目的としています。

エンボディドAIセクションでは、ロボット工学と人工知能における最新のブレークスルーを結集し、インテリジェントマシンの未来を形作る最先端技術を深く掘り下げます。主なトピックは以下のとおりです。

  • オープンソース・イノベーション:ロボット知能の飛躍的向上を推進する重要な原動力となりつつあるオープンソース・ロボット・オペレーティング・システム・プラットフォームの最新の進歩を理解します。よりスマートで柔軟なロボットを構築するには、効率的なデータ収集方法とモデル学習戦略の詳細な分析が不可欠です。
  • データ駆動型の未来:現実世界のデータと合成データを組み合わせて次世代のロボットデータセットを作成する方法を探ります。これにより、ロボットの産業用途が強化されるだけでなく、家庭環境でより大きな役割を果たすことも可能になります。
  • ビジュアルイノベーション: OpenCV などのオープンソース プロジェクトの最新の開発や、最新のオープンソース ビジュアル言語モデルを探索し、ロボット プロジェクトの無限の可能性を解き放ちます。
  • ヒューマノイド ロボットの台頭:オープンソースのヒューマノイド ロボットとロボット アーム エコシステムの開発動向に焦点を当て、これらのテクノロジが協働ロボットを新たな高みへと押し上げ、SF の夢を現実に変えている様子を紹介します。

OpenCVと空間インテリジェンス

OpenCVの創設者、ゲイリー・ブラッドスキー氏

ゲイリー・ブラッドスキーは、アメリカの科学者、エンジニア、起業家、作家であり、産業用ロボット向け認識アプリケーションを開発するIndustrial Perception(2012年にGoogleに買収)の共同創業者でもあります。彼はオープンソースのコンピュータービジョンライブラリ(OpenCV)の開発に携わり、それに関する書籍を出版しています。

トピックの概要:このプレゼンテーションでは、OpenCV の今後のリリースと、「空間インテリジェンス」(人工知能 + 空間における 3D ポーズ) に関する現在の取り組みについて紹介します。

具現化された知能の時代におけるオープンソースシミュレーションの役割

ドイツROSエンボディドAI財団エグゼクティブディレクター

ジャーマン・ロス氏は、非営利団体Embodied AI Foundation傘下のCARLAのエグゼクティブディレクターと、NVIDIAのシミュレーションエコシステム開発ディレクターを務めています。最新のシミュレーションプラットフォームを構築することで、安全な自律システムの開発と検証サイクルを加速することに情熱を注いでいます。彼の業務は、自律システムシミュレーション、人工知能、3Dコンピュータービジョン、コンピューターグラフィックスなど多岐にわたります。CARLA自動運転シミュレーターやOpen3D処理ライブラリといった大規模なオープンソースプロジェクトを主導してきました。以前は、Intelで自律エージェント研究ディレクターを務め、分散型の学際的なチームを率いて、デジタルツインとシミュレーションにおける新技術の開発に携わりました。また、トヨタ・リサーチ・インスティテュート(TRI)のリサーチサイエンティストも務めました。

トピック概要: 「具現化された知能」の時代において、オープンソースのシミュレーションプラットフォームはイノベーションとコラボレーションの推進において重要な役割を果たします。本プレゼンテーションでは、オープンソフトウェア/APIとクローズドソフトウェア/APIのバランスを探り、強力な組み込みAIシミュレーションツールを開発する際には柔軟性と拡張性が不可欠であることを強調します。CARLAをケーススタディとして用い、オープンソースの取り組みがどのようにコミュニティのエンゲージメントを促進し、研究を加速させ、多様な研究ニーズに対応する適応型ツールを提供しているかを紹介します。

具体化された協調ナビゲーションとインタラクティブ学習

清華大学コンピュータサイエンス学科教授、劉華平氏

清華大学コンピュータサイエンス学科教授。国家優秀若手研究者科学基金の受賞者、中国人工知能学会評議員、中国オートメーション協会知能自動化委員会委員長。ロボティクス・サイエンス・システム(RSS)の分野委員長、および国際ロボット研究誌(International Journal of Robotics Research)のシニアエディターを務める。主な研究分野は、知能ロボットのためのマルチモーダル知覚、学習、制御技術。

トピックの紹介:現在、複雑で高度に動的な環境において、ロボットの知覚と学習に対する要求はますます高まっています。群システムは、マルチロボット協調アプリケーションにおいて大幅な効率向上とアプリケーションの飛躍的進歩をもたらしましたが、同時に、群知能の知覚と学習に関する理論研究と工学応用に大きな課題をもたらしています。本トピックでは、マルチロボット協調タスクの要件における2つの主要なカテゴリー、すなわち、異種ロボットプラットフォーム間の知覚・行動能力の違いに適応する状況理解と、広域動的シナリオにおける効率的かつ堅牢な知覚について考察します。本トピックでは、異種マルチロボットの知覚・学習能力を活用して群の効率向上と行動創発を実現する方法に関する関連研究の進展を紹介します。

モーションキャプチャ技術を活用したスマートファクトリーの構築

ダイ・ルオリ、Noitomの共同創設者兼最高技術責任者

戴若麗博士は、Noitom Limitedの共同創業者兼最高技術責任者です。香港中文大学で2004年に哲学修士号、2007年に博士号を取得しました。2014年9月には香港中文大学機械・自動化工学部より優秀卒業生賞、2017年3月には香港中文大学工学部より優秀卒業生賞を受賞しました。戴博士は、モーションキャプチャ技術、コンピューターグラフィックス、視覚化技術、3Dモデリングおよびレンダリング技術、映画およびテレビの特殊効果、仮想現実および拡張現実技術、ロボティクス、人工知能など、最先端技術の開発において豊富な経験を有しています。ロボットのトレーニングデータセットの取得に強い研究関心を持ち、モーションキャプチャベースのロボット遠隔操作、関連データセットの準備、構成間のトレーニングデータマッピング、シミュレーション環境での合成データ生成などの分野で豊富な経験を有しています。 Noitomの技術リーダーである戴博士は、研究開発チームを率いて最先端の革新技術の研究と応用に取り組んでいます。彼のリーダーシップの下、「ワイヤレス高速全身モーションキャプチャシステム」と「大空間フリーローミングマルチユーザー複合現実シミュレーションプラットフォーム」は、国際トップレベルの水準に達しています。

トピック概要:本トピックでは、まずモーションキャプチャ技術と身体型知能ロボット分野の関係性を探ります。Noitomのモーションキャプチャソリューションを身体型知能ロボット分野に適用したワークフローを紹介し、ワークフロー全体における人体とロボット本体のマッピングの重要性と課題を強調します。また、主流の4つのロボットデータセット作成方法の違いについても解説します。最後に、Noitomと業界パートナーとの実装事例を紹介することで、大規模な身体型知能データファクトリー構築の重要性と実現可能性を改めて強調します。

Rapier: 分散物理シミュレーションに向けて新たな一歩を踏み出す

セバスチャン・クロゼ・ディムフォルジュ、創設者

彼は、線形代数、幾何学、物理学に特化したnalgebraやRapierなど、Rustエコシステムにおける人気のオープンソースライブラリの開発者兼メンテナーです。また、エンジニアリング、ゲーム、メタバースにおける幾何学と物理学の未来の開発に注力するDimforgeの創設者でもあります。

トピックの紹介: Rapierは、Rust専用に設計された強力なオープンソース物理エンジンです。この講義では、Sébastienが分散物理シミュレーションに関する最新の研究成果と、物理エンジンの独自の機能を活用してパフォーマンスを向上させる方法について紹介します。

dora-rsでロボットアームのAIモデルを簡単に微調整

1ms.aiの創設者、ザビエル・タオ氏

ザビエル・タオは、機械学習/人工知能(AI)のユーザーとエンジニア向けにオープンソースを通じて実用的なソリューションを開発するフランス企業、1ms.aiの創設者です。同社のプロジェクトの一つであるDora-rsは、ボット構築を迅速かつシンプルにすることを目的としています。彼は、コンサルティング(ボストン・コンサルティング・グループ、BCG)、銀行(BNPパリバ)、テクノロジー(Futurewei Technologies)など、複数の業界にわたる実用アプリケーション向けのAIモデルを開発してきました。

トピックの概要:ロボットの自律化をより簡単に。このトピックでは、わずか数ステップでモデルのトレーニングを開始し、タスクを自動化する方法を紹介します。これは、AIモデルの微調整を非常に簡単にするdora-rsのおかげです。

OpenLoongコミュニティ: ヒューマノイドロボットのためのオープンで協調的なオープンソースエコシステムの構築

ヒューマノイドロボティクス(上海)のエンボスアルゴリズム担当ディレクター、ティアン・チョン氏

田崇氏は、国内外のヒューマノイドロボットイノベーションセンターにおいて、具現化アルゴリズム業務を担当し、ヒューマノイドロボット技術の革新的研究に注力しています。OpenLoongコミュニティにおける強化学習(RL)コンポーネントの発起者として、オープンソースコミュニティにおいて重要な役割を果たし、ロボット工学分野における強化学習技術の研究と応用を積極的に推進しています。青龍ヒューマノイドロボットの動作制御アルゴリズムの中核開発者として、彼はチームを率いていくつかの重要な技術革新を実現し、青龍ヒューマノイドロボットの動作性能と安定性を大幅に向上させました。

トピックの概要:本プレゼンテーションでは、OpenLoongコミュニティの設立、発展、成果、そして将来の展望について考察します。中国を代表するオープンソース・ヒューマノイドロボットコミュニティであるOpenLoongは、ヒューマノイドロボットの知能化技術の開発促進と、開発者間のコミュニケーションとコラボレーションの促進に尽力しています。本プレゼンテーションでは、コミュニティの成功事例、課題、そしてオープンコラボレーションを通じてより活気のあるオープンソース・ヒューマノイドロボット・エコシステムを構築する方法について共有します。

機能的な自律走行車のためのタスクモデリング手法

重慶郵電大学自動化・ロボット工学科長 實明

崑明氏は、2006年に中国科学院大学院で光工学の博士号を取得しました。現在は重慶郵電大学教授です。これまで、車載エレクトロニクスおよび組み込みシステム研究開発センターでソフトウェアシステムアナリストおよび副所長を務めました。研究分野は、情報融合、複数目標追跡、自動運転、知能ロボット工学などです。

トピックの紹介:配送、販売、シャトル、警備巡回といったインテリジェントなタスクを実行できる車両として、機能的自律走行車(ADAS)はまさにインテリジェンスの真髄を体現したと言えるでしょう。インテリジェントなタスクの多様性を考慮すると、機能的ADASの迅速な開発と展開には、普遍的なタスクモデリングと実行手法の設計が不可欠です。このトピックでは、この分野における具体的な実践例を考察します。

具現化された知能の行動学習にはどのようなデータが必要ですか?

Roboraction.AIのCEO、ユー・ホアン氏

上海汽車特区科技の主任自動運転科学者、上海大学客員教授、黒芝麻科技の自動運転研究担当副社長、Singulato USAの会長を歴任。2020年にはアジア太平洋信号情報処理協会(APSIPA)の優秀業界リーダーに選出。国際会議や学術誌に40本以上の論文を発表し、米国と欧州で18件の特許を保有。著書に『自動運転システム開発』(中国語版)がある。西安交通大学で学士号、西安電子科技大学で修士号、北京交通大学で博士号を取得。また、AvH(アレクサンダー・フォン・フンボルト)研究員(ドイツ)、イリノイ大学イリノイ大学ベックマン科学研究所のポスドク研究員でもある。

トピック紹介:大規模言語モデルの出現により、身体性AIは汎用人工知能(AAI)実現への基本的な道筋と考えられています。しかし、LLMと比較すると、身体性AIの進歩において、データは現在重要なボトルネックとなっています。本発表では、まず学習戦略、特に身体性操作に関する学習戦略を分析します。次に、身体性AI分野における様々な公開データセットを調査します。最後に、必要な身体性AIデータセットの要件をまとめ、Unreal Engine 5でレンダリングされた近日公開予定の合成ビデオデータセット「MVGameIR」を紹介します。

Eclipse Zenoh: 汎用および異種AIシナリオの両方に対応する通信バックボーンネットワーク

Julien Loudet、Eclipse Zenoh-Flow の主任開発者

Julien Loudet氏は、ZettaScale TechnologiesにおいてEclipse Zenoh-FlowプロジェクトとEclipse Zenohのストレージレプリケーション機能を率いています。博士号を取得しており、在学中は分散システムのセキュリティを専門としていました。

トピックの概要:人工知能(AI)はあらゆるところに浸透し、新しいテクノロジーとのインタラクションの多くを向上させています。この広範な現象は、シームレスなデータフローを可能にする堅牢な通信バックボーンを必要としています。このトピックでは、次世代通信ミドルウェアであるEclipse Zenohについて詳しく説明します。

AIRSTONE: 具現化された知能でビジネスを強化するインフラストラクチャ

深圳人工知能ロボット研究所 身体知能センター所長 劉少山

深圳社会応用人工知能ロボティクス研究所(AIRS)の組み込み人工知能部門のディレクター。テクノロジー、起業家精神、公共政策の統合に注力。テクノロジー分野では、4冊の教科書と100本以上の研究論文を出版し、自律システムに関する150件以上の特許を保有。起業家精神においては、PerceptInのCEOを務め、米国、欧州、日本、中国で自律型マイクロモバイルサービスを展開。また、IEEEアントレプレナーシップのアジア地域議長も務める。公共政策分野では、世界経済フォーラムの「政府調達政策に対する産業界の対応」パネルメンバーを務め、IEEEデバイス・システム国際ロードマップ(IRDS)に基づく自律マシンコンピューティングロードマップを主導。ACM米国技術政策委員会メンバー、国立行政学院技術リーダーシップグループの諮問グループメンバーも務める。バイオメディカル工学の理学修士号と博士号を取得。カリフォルニア大学アーバイン校でコンピュータ工学の学士号を取得し、ハーバード大学ケネディスクールで行政学修士号(MPA)を取得しました。

トピックの概要:本プレゼンテーションでは、AIRSTONEプロジェクトがEAIの商業化をどのように推進しているかを紹介します。エンボディドAIとは、ロボットなどの物理的な物体に人工知能を組み込み、知覚、学習、そして周囲の環境との動的な相互作用を可能にすることで、ロボットが環境の変化に適応できるようにするものです。本プレゼンテーションでは、エンボディドAIが直面する計算上の課題を概観し、エンボディドAIコンピューティングシステムの構築に向けたいくつかの研究方向性を探ります。

OpenCSG エンボディドインテリジェントデータプラットフォーム

ドン・カオ、シニアエンジニア

南京科技大学で博士研究員(人工知能と認知推論)を修了し、博士研究員として博士号を取得しています。人工知能を専門とするシニアエンジニアです。中国電子学会、IEEE、ACM、中国コンピュータ連盟のシニアメンバーです。上海市大規模モデル信頼性指標システム専門家グループのメンバー、および上海市インダストリアルインターネット産業推進センター専門家委員会のメンバーでもあります。人工知能分野で10年以上の研究開発経験を持ち、認知知能、身体性知能、マルチモーダル研究などの分野で30本以上の論文を第一著者として発表しており、そのうち21本はSCI/EI索引論文です。以前は、Wind Information Technology Co., Ltd. で上級アルゴリズム専門家として認知推論および質問応答システムの研究開発を担当し、また DeepBlue Technology (Shanghai) Co., Ltd. では認知インテリジェンス研究所所長として視覚推論および認知インテリジェンスアルゴリズムの研究開発を主導しました。

トピックの概要: OpenCSG は、データ サイエンティストと開発者に、具体化されたインテリジェンス アプリケーション シナリオ向けの効率的で包括的なデータセット処理ソリューションを提供するように設計された強力な具体化されたインテリジェンス データ プラットフォーム製品である CSG DataFlow をリリースしました。

限界を打ち破る:ロボットの終焉を探る

リアルマン・インテリジェント・テクノロジーの共同創設者、アレン・シュー氏

リアルマンインテリジェントテクノロジーの共同創設者は、ロボットを各家庭に普及させることを目指し、コアコンポーネントの研究開発から始め、世界初の超軽量ヒューマノイドロボットアームを独自に開発しました。

GOSIM CHINA 2024 (北京) 10月17日~18日

1000人以上のオープンソース開発者

国内外から60名以上の上級専門家

100以上の高品質なコンテンツセッションを含む6つのテーマ別技術フォーラム

2つのハッカソン...

ビッグネームが集結する、壮大なイベントが皆様のご参加をお待ちしております。早割チケットは数量限定、先着順となります。

詳細については、会議の公式ウェブサイトをご覧ください: https://china2024.gosim.org/zh

GOSIMオープンソースイノベーションフォーラムより転載

編集:王俊

関連資料

2024年オープンソース会議の概要

第9回中国オープンソースカンファレンスフォーラムの参加募集が正式に開始されました

オープンソース協会の紹介

2014年に設立されたオープンソース協会(KAIYUANSHE)は、オープンソースの理念に献身的に貢献する個々のボランティアで構成されるオープンソースコミュニティであり、「貢献、合意、そして共同統治」の原則に基づき活動しています。KAIYUANSHEは、「ベンダー中立性、公益性、非営利性」の原則を堅持し、「中国を拠点とし、世界に貢献し、新時代のライフスタイルとしてオープンソースを推進する」というビジョンを掲げています。その使命は「オープンソースのガバナンス、国際的な連携、コミュニティの発展、そしてプロジェクトのインキュベーション」であり、健全で持続可能なオープンソースエコシステムの共創を目指しています。

オープンソース協会は、オープンソースを支援するコミュニティ、大学、企業、政府機関と積極的に連携しています。また、世界的なオープンソースライセンス認証組織であるOSIの中国初の会員でもあります。

2016年以降、中国オープンソースカンファレンス(COSCon)が毎年開催され、「中国オープンソース年次報告書」が継続的に発表されています。また、「中国オープンソースパイオニアリスト」と「中国オープンソースコードパワーリスト」も共同で立ち上げ、国内外で幅広い影響力を発揮しています。