|
この障壁…一夜にして話題となったマヌス島に、オープンソースのレプリカが登場! 5 人が 3 時間を費やして、列に並ぶことなく完全に無料でOpenManus を体験できるようにしました。 再現性の度合いについては、Manus 公式チームとオープンソースチームが提供するデモを直接比較するのが一番です。 世界初の汎用インテリジェントエージェントとしての公式ケーススタディは次のとおりです。 OpenManus チームの 3 時間のレプリカは次のようになりました。 ぜひご自身でその効果を体験してください。 実践的なスキルに長けた方は、ぜひお試しいただき、フィードバックをお寄せください。 オープンソースからManusの実装パスを辿る同時に、OpenManus をさらに深く調べることで、Manus を実装するための合理的な方法を実際に見ることができます。 (Manus が現在使用しているモデルやエージェント フレームワークなどの具体的な詳細は機密です。) 要約すると、OpenManus の背後には 3 つの重要な要素があります。
詳しく言うと、その中核となる設計はこのモジュール式エージェントシステムにあります。開発者は必要に応じてさまざまな機能モジュールを自由に組み合わせ、独自のAIアシスタントを作成できます。 OpenManus では、さまざまな役割を持つエージェントが協力して、需要の理解、計画、行動などのタスクを完了します。 たとえば、Manus メイン エージェントはプロジェクト マネージャーのような役割を担い、ユーザーのニーズを理解してタスクを割り当てる役割を担います。PlanningAgent はプランナーのような役割を担い、複雑なタスクを実行可能なステップに分解する役割を担います。ToolCallAgent は技術専門家のような役割を担い、さまざまなツールの使用を管理する役割を担います。 上記のすべては、オープンソース チームによって提案された MetaGPT (マルチエージェント フレームワーク) を使用して実装されており、開発者は複数の適切な大規模言語モデルを自由に統合できます。 さらに、OpenManus のもう 1 つの重要な側面は、その思考プロセスがオープンかつ透明であることです。 冒頭の例で述べたように、タスクを受け取った後、OpenManus は問題についてどのように考えているか、どのように実行する予定かについてリアルタイムのフィードバックを提供できます。 これにより、適切なタイミングで人間が介入する「ウィンドウ」が提供され、タスクをより高品質で完了できるようになります。 最後に、エージェントのツールの使用について触れておく必要があります。 複雑なタスクを実行するために、OpenManus には一連の「外部補助」も装備されています。
さまざまなツールはスタンドアロン モジュールではなく、共同設計が必要であることに注意することが重要です。 上記を組み合わせると、このタイプのマルチエージェントシステムの一般的なアーキテクチャは次のようになります。最下層はさまざまな大規模な言語モデルで構成され、中間層はマルチエージェントのコラボレーションを通じてタスクを分解し、実行層はさまざまな API インターフェイスを呼び出して特定の操作を完了します。 要約すると、OpenManus の作者によれば、このオープンソースの成果は、コンピューターの使用、基本的なエージェント、および統合された計画機能を組み合わせたものです。 OpenManus チームがプロジェクトの謝辞で述べたように、Claude のベンダー Anthropic が昨年開始したcomputer-useと、Y Combinator が投資したプロジェクトbrowser-use の両方が、OpenManus に基本的なサポートを提供しました。 名前が示すように、これら 2 つのプロジェクトはそれぞれコンピューターとブラウザーを操作するために使用され、サンドボックス環境での操作が Manus の動作の中核を成しています。 5人の開発チームが3時間でレプリカを完成させました。OpenManus チームはコア システムをわずか 1 時間で完成させ、システム全体はわずか 3 時間で完了しました。 コア著者の Liang Xinbing 氏によると、OpenManus の急速な立ち上げは、MetaGPT によって構築された技術的蓄積によるものです。 (注: MetaGPT はマルチエージェント フレームワークです。複雑なタスクを処理するために、GPT モデルにさまざまな役割が割り当てられ、協力的な「ソフトウェア会社」が形成されます。) 蓄積されたエージェント ツールキットとともに、ブラウザー ツールチェーンを既存のコードに単純に移植しました。 R&D メンバーの何人かは MetaGPT チームからも参加しました。 「Devin のオープンソース バージョン」であるデータ インタープリターも、MetaGPT チームの製品です。 OpenManus の中心的な作者である Liang Xinbing は、華東師範大学を卒業し、在学中に Data Interpreter の作業に参加しました。 もう一人の中心的な著者であるXiang Jinyuは、西南交通大学応用物理学科で学士号を取得しました。 昨年、大学4年生だった彼とチームメイトは、GPT-4とClaude 3で構成されるマルチエージェントソリューションを使用して、AIが複数の役割を果たし、互いに検証して回答手順を完了できるようにし、Alibaba数学コンペティションのAIトラックで世界第2位を獲得しました。 MetaGPTコミュニティでは、Xiang Jinyu氏と他のメンバーもエージェントが「Minecraft」でダイヤモンドをうまく収集するのを手伝いました。 彼はAIエージェントに人気Zhihuユーザーになりすまし、100以上の質問に答えさせ、3万回以上の視聴回数に加え、「いいね!」や反論、さらにはプライベートメッセージまで獲得させました。AIの正体は、彼が止めるまで明かされませんでした。 張嘉義氏は昨年、中国人民大学高陵人工知能学院を卒業し、現在は香港科技大学(広州)で博士課程に在籍しています。同氏が開発したインテリジェントエージェントフレームワーク「AFlow」は、ICLR 2025に採録されており、項金宇氏との共著者です。 Yu Zhaoyang と Zhang Jiayi は人民大学の同級生でした。Hong Sirui は、MetaGPT と Data Interpreter の論文の共同筆頭著者であり、DeepWisdom の上級研究員で、香港科技大学で修士号、曁南大学で学士号を取得しています。 AFlow の著者には Zhaoyang Yu 氏と Sirui Hong 氏がいます。 今年は、張嘉怡氏や向金宇氏を含む5人が、キューワードが自ら進化することを可能にするSPOというプロジェクトに共同で参加し、面倒なキューワードエンジニアリングの研究プロセスから人々を解放しました。 さらに、5人の著者の経験と著者情報に基づくと、2015年に修士号を取得し、やや年上の洪思瑞氏を除けば、他の4人の著者はほぼ全員が最近学部を卒業したばかりであることが推測されます。中にはさらなる研究を続けることを選んだ者もいれば、DeepWisdomに入社した者もいます。 マヌス島の「貝殻論争」を再考するさらに、OpenManus の出現は、Manus をめぐる「砲撃論争」に新たな視点をもたらす可能性もあります。 この事件を簡単に振り返ってみましょう。 マヌスが「殻」であると非難されてきたのは、主に次の 2 つの理由による。 まず、学ぶべき前例があります。ManusのチームはMonicaという別の製品を開発しました。これは、様々な大規模言語モデルを統合するプラグインとして、かつてシェルであるかどうかで論争を巻き起こしました。 したがって、人々は特定の企業の製品を見ると簡単に連想することができます。 このことから、この製品は貝殻を縫い合わせて作られている疑いがあるため、マヌス島の技術力が低いという印象を持たれやすい。 ただし、OpenManus は、その再現パスに基づいて、多くのモジュールが既存のオープンソース プロジェクトに基づいて実装されているため、新しい視点であると考えられています。 さまざまなモジュールの全体的な調整とスケジュールを実現して新しい機能を作成することは、誰もができることではありません。 さらに、オープンソース コミュニティの大きな利点の 1 つは、後続の開発者が巨人の肩の上に直接立つことができることです。 オープンソースを考慮しなくても、大手モデルメーカーが開発者に API を提供する目的は同じです。つまり、開発者が新しいアプリケーションを開発できるようにすることです。 もっと劇的に言えば、Perplexity の創設者の言葉を引用すると、「OpenAI は単なる殻に入った Nvidia であり、Nvidia は単なる殻に入った TSMC であり、TSMC は単なる殻に入った砂です...」 したがって、それが「シェル」であるかどうかは中核的な問題ではなく、それが実質的な生産性の向上を生み出すことができるかどうかが鍵となります。 しかし、昨日の実際のテストに基づくと、 Manus はまだこの目標の達成には程遠いようです。 したがって、リブランディングの詳細にこだわるよりも、製品の機能を改良することの方が重要だと考えられます。 マヌス島についてどう思いますか?ぜひ下のコメント欄にご意見をお寄せください。 オープンソース アドレス: https://github.com/mannaandpo... |
5 人が 3 時間で Manus のオープンソース バージョンを複製しましたが、招待コードは必要ありませんでした。
関連するおすすめ記事
-
信頼できるオープンソースと業界の進歩を共に – 2024年OSCARオープンソース業界カンファレンスが正式に開始
-
Intel と AMD が今世紀に向けて力を合わせます。AI と Lenovo のおかげ。
-
[イベント招待 - 広州] インテリジェンスの新時代:AIが未来を動かす!
-
最大のオープンソースロボットデータセット!DeepMindは21の機関と協力し、60のデータセットを統合してOpen X-Embodimentをリリースし、具現化された知能の時代を切り開きました。
-
トヨタの利益は半減した!
-
最も優秀なAIプログラマーが職を失いつつある。彼は84秒でコードを実行し、人間のように考えることができるのだ!彼のチームはたった5人しかいない。