|
計算してみると、DeepSeek の「Nezha Conquers the Dragon King」シリーズが始まってまだ 1 か月しか経っていないことになります。 春節の騒動の余波がほとんど収まらない中、今日、中国の新興大型模型キットメーカーのトップ6社のうちの1社であるStep UPが、 Step UP Ecosystem Open Dayでこの騒動に対応した。 技術をただまとめるだけでは十分ではありません。実践的にまとめることも重要です。 「来年の春節にはAIがさらに強くなることを期待すべきだ」。エコシステムオープンデーで、Jieyue Xingchenの創設者兼CEOであるJiang Daxin氏は冗談めかして訴えたが、業界全体が春節(ドージ)中にモデルをリリースしないことに同意するのが最善だろう。 話を本題に戻しましょう。オープンデーの最大のハイライトは、やはり StepLeap が行った大きな、大きな動きでした。 同社はすでに、スマート端末にエージェントを展開し、独自の大規模モデルで主要産業を強化するための包括的な戦略とソリューションを実装しています。 2本の矢が同時に打ち上げられ、その様子は一般公開され展示されました。 エージェントに必要なマルチモーダルおよび推論スキルはすべてこの本ですぐに入手できます。なぜ業界では 2025 年がエージェント元年であるという一般的な合意があるのでしょうか? 江大新氏は、エージェントの爆発的な成長に必要な2つの条件、すなわち「マルチモーダル機能」と「推論機能」が、2024年に両方とも飛躍的な進歩を遂げたため、その答えを提示した。 これら 2 つのうち、マルチモーダル機能により、エージェントは世界を完全に認識して理解することができます。一方、推論機能により、エージェントはゆっくりと考え、積極的に計画、試行、検討し、継続的なエラー修正を通じて正確な回答を提供するという長い CoT (思考連鎖) を実行できます。 諺にもあるように、知識と行動は一体です。Jie Yueは洞察力と判断力を発揮し、マルチモーダルと論理的思考の両面で即座に行動を起こし、大きな成果を上げました。 マルチモーダル性は、常にステップ遷移の強みとなっています。 AIモデリングコミュニティに「模範的従業員賞」があったとしたら、Jieyue Xingchenは「1年間で11のマルチモーダルモデルをリリース」という業績により最終候補に挙がる可能性が高く、業界で認められた「マルチモーダルモデルの王」という称号は当然のものです。 これら 11 個のマルチモーダル大規模モデルは、音声認識、音声生成、マルチモーダル理解、画像およびビデオ生成など、幅広い機能をカバーします。 わずか4日前、Step-LeapとGeely Automobile Groupは共同で、最も強力なマルチモーダルモデル2つ、ビデオ生成モデルStep-Video-T2Vと大規模音声インタラクションモデルStep-Audioをオープンソース化しました。これらは、最もオープンで寛容なMITオープンソースライセンスを採用しているだけでなく、両モデルともStep-Leapの「Leap Ask App」で体験できるようになりました。 中でも、Step-Video-T2Vは300億個のパラメータを持ち、パラメータ数で世界最大のオープンソース動画生成モデルとなっています。最大204フレーム、解像度540Pの動画を直接生成できます。 蒋大新氏はイベントで、Jieyue も来月(3 月)に自社開発した画像ベースのビデオ モデルをオープンソース化することを明らかにした。 推理力に関しても、Jie Yue はかなり蓄積してきました。 今年1月、Stepシリーズ初の推論モデルとなるStep R-miniがリリースされました。LiveCodeBenchコーディングタスクにおいて、o1-previewを上回るパフォーマンスを達成しました。 Jiang Daxin 氏は、昨日 GitHub にアップロードされたばかりのプロジェクト、Open-Reasoner-Zero についても簡単に紹介しました (絵文字 ORZ も理解できるなら、私たちは同い年くらいのはずです...)。 これは、StepLeapと清華大学が共同で完成させた、事前学習済みモデルから直接大規模強化学習を行う初のオープンソース実装です。DeepSeek -R1-Zero方式を用いた同規模のモデルと比較して、約4%多い学習反復回数でスコアを上回る結果を達成しました。 しかし、これはほんの始まりに過ぎませんでした。 Step R-mini がリリースされたとき、Step Leap は公式 WeChat アカウントでサプライズを発表し、よりインタラクティブな形式で推論機能を大型モデルに統合していることを明らかにしました。 江大新氏はその場で、現在の視覚的理解はまだ「速い思考」の第一段階にあると付け加えた。しかし、複雑な問題に遭遇した際には、テキストと同様に、ゆっくりとした思考と思考の連鎖能力が依然として必要となる。 つまり、ステフは自信を持って、マルチモーダル視覚推論を開始する意志を宣言したのです。 インテリジェント端末エージェントに着目し、「クルマ+携帯電話+IoT+インテリジェンス」を包括した戦略を展開。エージェントに必要な 2 つの重要な機能が手の届く範囲にあり、テクノロジが現実世界に展開されると、それはいつでも射られる矢となり、放たれなければなりません。 Step は、エージェントを垂直エージェントとスマート ターミナル エージェントの 2 つの主なカテゴリに分類します。 この飛躍のターゲットとして、現在最も注目を集めているのが「スマート端末エージェント」です。 冒頭で述べたように、ステップ ロール テクノロジーの鍵は、それを実際のアプリケーションに組み込むことです。これは、エージェントに対するステップの姿勢、つまり無駄を省き、迅速に展開し、直接実装するという姿勢から生まれます。 チャンスは一瞬で過ぎ去るため、Leap はすべての主要なエッジ シナリオにわたってリソースを迅速に展開し、「車両 + 携帯電話 + IoT + 具現化されたインテリジェンス」を網羅する包括的な業界レイアウトを形成しました。 より多くの開発者が、敷居が低く、低コストで、高効率な方法で革新的なブレークスルーを達成できるよう、Leapは新たにアップグレードされた「Starry Skyプロジェクト」の第2フェーズを開始しました。このプロジェクトは、エージェントアプリケーション開発者に対し、モデル、コンピューティング能力、資金、データ、ビジネスインキュベーションなどの分野における包括的なサポートを提供することを目的としています。 スマートカーインテリジェント車両の開発につながる戦略的提携や協力についての手がかりがいくつかあります。 4日前に発売された2つのマルチモーダル大型モデルは、JieyueとGeely Automobile Groupが共同でオープンソース化したものだ。 Jieyue Open Day イベントで、Jiang Daxin 氏は、自動車がエンドユーザー エージェントにとって最も重要なアプリケーション シナリオであるという自身の見解を改めて明確に述べました。
したがって、Step シリーズの大型モデルを車両にうまく実装するには、業界の共同の取り組みが不可欠です。 そのため、今日のオープンデーで、 JieyueはGeely Automobile GroupおよびQianli Technologyとの技術提携をさらに強化し、「AI +自動車」の深い統合を共同で推進することを正式に発表しました。 ポイントは「AI+クルマ」。 蒋大新氏の見解は、これまで真の「AI+」コアアプリケーション製品は登場していないというものだ。ChatGPTのリリース以来、頻繁に議論されてきたAIネイティブというコンセプトは、大規模AIモデルの時代における全く新しいアプリケーションを示唆するものとなるはずだ。 たとえば、AI が 50% 以上を占め、それが生み出す価値が 10 倍になるはずです。 言うまでもなく、これら 2 つの標準のどちらも現在まで実装も適用もされていないことは一目瞭然です。 しかし、広範な市場調査と観察を行った結果、Jieyue は、今後 3 年間で、L3 および L4 インテリジェント車両が徐々に実装および推進され、車両への大規模モデルの適用には特に大きな可能性と希望があるという結論に達しました。 こうして、Jieyue、Geely、Qianliの共同の努力が達成された。 個別に見ると、Jieyue と Geely の連携により、自動車製造、インテリジェント コンピューティング プラットフォーム、衛星ネットワークなどの分野における Geely のインフラストラクチャの優位性が活用されます。 Qianli Technology とのコラボレーションは、Qianli の製品イノベーション能力と密接に統合されます。 Jieyue の大型モデルにおける技術蓄積と共同の努力により、大型モデルの新たな AI の勢いを自動車のインテリジェント化に注入し、「最高のエコシステムで最高のエコシステムを提供する」ことを目指します。 吉利汽車グループ副社長兼吉利汽車研究所所長の李伝海氏は、3者が「コンピューティングパワーセンター、ビッグモデル、インテリジェントアーキテクチャ、インテリジェントドライビング、インテリジェントキャビン、チップ、携帯電話、衛星、航空機」を含む完全なインテリジェントエコシステムを構築することを明らかにした。 千利科技会長のYin Qi氏は、 AIビッグデータモデル、エンドツーエンドのインテリジェント運転、コックピット統合などの技術の飛躍的進歩により、インテリジェント車両の体験が量的変化から質的変化へと飛躍的に進歩すると期待している。 携帯端末実際、AI 2.0 の登場以降、多くの大規模モデルが実装される際には、モバイル デバイスがハードウェア プラットフォームとして好まれています。 現在の携帯電話市場を見てみると、OSに関わらず、「AIがなければ携帯電話もない」というのが現状です。現代人が携帯電話にこれほど執着していることを誰が責められるでしょうか…? スマート端末エージェントを様々な場所に侵入させることを決めたので、Jieyue は当然この機会を逃しませんでした。 公式紹介によると、同社のアプローチは「携帯電話メーカーと緊密に協力してエージェント技術を携帯電話に統合し、より優れたインタラクティブな体験を共同で生み出す」ことだという。 このオープンデーで Jieyue が発表した最初のパートナーは OPPO です。 昨夜、QuantumBitは深圳へ飛び、OPPOが世界初のSnapdragon 8 Ultra搭載折りたたみ式フラッグシップモデル「OPPO Find N5」を発表した様子をライブレポートしました。ベースモデルの価格は8999元で、iPhone 16 Proよりも高価です。展開すると1元玉2枚分の価格となり、Step Multimodal Technology(ステップ・マルチモーダル・テクノロジー)を搭載しています。 オープンデーイベントでは、OPPOのスマートアシスタント部門の部長であり、Xiaobuアシスタントの責任者であるWan Yulong氏が、Jieyueとのコラボレーションについて詳細に紹介しました。 OPPOは、Stepシリーズのマルチモーダルモデルに基づいて、「ワンクリック画面照会」と「ワンクリックオールインワン検索」という2つの主要なAI携帯電話機能を開発しました。 「ワンクリック スクリーン アスキング」機能の背後には、数千億のパラメータを持つマルチモーダルな大規模モデルがあります。 このサポートにより、OPPO は次の機能を実現できます。
「ワンクリックオールインワン検索」の背後にはエージェント機能があり、ユーザーは音声またはテキストで自信を持って携帯電話にコマンドを与え、残りのすべてを AI に任せることができます。 ユーザーはOPPOのXiaobu Assistantにコマンドを与えるだけで、AIが独自にさまざまなアプリに入り、ワンクリックですべてのアプリを検索したり、コマンドに従って一連の検索と実行操作を完了したりするなどのタスクを完了できます。 万宇龍氏はスピーチの中で、今後OPPOとJieyueは「よりパーソナライズされたスマートアシスタント体験を創造する」ために協力を深めていくと述べた。 具現化された知能とIoT大型モデルとロボットの連携には当然の利点があり、特に具現化された知能が現れ始めると、大型モデルが具現化された知能の頭脳として機能し、両者の利点がさらに顕著になります。 具現化された知能に関して、Step が現在行っていることは、「具現化された領域におけるエージェントの革新的な応用を促進する」ことと要約できます。 この分野では、Jieyue の最初のパートナーは、同じく上海を拠点とするスタートアップ企業である Zhiyuan Robotics(Zhihui Jun が創業した企業と同じ)であり、「AI + 具現化ロボット」の応用シナリオを共同で模索しています。 さらに、 IoT端末に関しては、StepLeapはオープンエコシステムアプローチを通じて連携し、TCLを含む一連のIoTプラットフォームおよびデバイスメーカーと緊密に連携して、インテリジェントなアップグレードとデバイス間のシームレスな接続を促進しています。 控えめながらも包括的な業界実装が進行中大規模モデルを実現するのは難しいのでしょうか? この質問は、大型モデルが初めて導入されて以来ずっと聞かれ続けており、多くの人が聞き飽きています。 この質問に直面すると、大規模モデルによって達成された大きな技術的進歩にもかかわらず、過去 2 年間の技術的進化を考慮すると、多くの人が肯定的に答えるでしょう。 技術の互換性、データのセキュリティ、費用対効果などの問題に直面し、大規模モデルの導入の難しさは、現在の AI 技術開発における中心的な課題の 1 つと考えられています。 しかし、業界ではまだ「大規模モデルを現実に根付かせることができるか」が議論されている一方で、アクション指向のJieyueはすでにケーススタディで自らを物語っており、ニューリテール、金融、コンテンツ制作、デジタルヒューマンの業界パートナーと緊密な協力関係を築き、垂直シナリオで革新的なCエンドアプリケーションエクスペリエンスを共同で生み出している。 新しい小売業の面では、Jieyue は第三者と協力して、技術研究開発から消費シナリオまでのクローズドループを構築し、より豊かで興味深く、有用な消費シナリオを模索しています。 本日、Jieyueは、汎用GPUハイエンドチップおよびスーパーコンピューティングシステムのプロバイダーであるTianshu Zhixinと共に、Luckin Coffeeとの戦略的提携を発表しました。これは、新しい小売ブランド、ベースモデル企業、そしてコンピューティングパワーサービスプロバイダーを統合した、中国初の「AI + New Retail」協力モデルとなります。 今後、3社はラッキンコーヒーの広範なオフライン店舗とオンラインプレゼンスを活用し、新小売業界の情報レベルをさらに高めていく。 金融経済分野では、Jieyue が誕生した当初から、上海メディアグループの子会社 Jiemian Finance と共同で大型モデルテクノロジー企業 Caiyue Xingchen を設立し、金融経済分野での大型モデルの応用を模索してきました。 現在、Caiyue Xingchenは金融業界向けのCaiyueビッグモデルをリリースしており、上海人工知能実験室が上海財経大学、上海クーパーズテクノロジー株式会社と共同で発表した「金融分野におけるビッグモデル評価レポート(2024年)」において、マルチモーダルパフォーマンスで1位を獲得しました。 消費者向けに発売された資産管理アシスタント「AI小財神」は、現在、AIデータマイニング、AI対話、財務レポート解釈などの機能をユーザーに提供しています。 さらに、Jieyue Xingchenは太原君安証券、傑面金融と提携し、業界初となる数千億のパラメータを持つ大規模証券垂直モデル「君紅凌熙大規模モデル」を発表し、大規模モデル機能をユーザーのインテリジェントサービスシステムに全面的に統合する先導役を果たした。 オープンデーイベントでは、QuantumBit は、StepLeap とさまざまな業界のサードパーティとのコラボレーションの成果を観察し、体験しました。 「胃之図鑑」や「森林治癒室」などの有名AIアプリ、若者向け抽象創作コミュニティ「Lipu」、AIライフレコーディングコンパニオン「Xinguang」、AI搭載アイドル共有・取引プラットフォーム「Tre Loop」、3年間で10万台以上を出荷した「Lesen Robot」など… 見回すと、StepLeap がさまざまな業界において「大規模モデル技術の実装は実現可能であり、大きな可能性を秘めている」という例を示していると確信できます。 StepUpエコシステムオープンデーでの半日の経験を経て、QuantumBitの個人的な感想は深まりました。 DeepSeekの「春節奇襲攻撃」からJieyue Xingchenの「エコシステム反撃」まで、2025年のAI戦場はますます明確になりつつあります。 技術革新は単なる始まりではありません。産業への応用こそが真の最終結果です。 Jie Yueが先頭に立って、業界の大型モデルに最も強い脚色を発表しました。 しかし、この変革には勝者総取りの神話は存在せず、特定のシナリオを深く掘り下げる長期的思考者だけが存在し、最終的な勝利は必然的に実用派に属することになるということを認識して強調しなければなりません。 AIレースの後半は、パラメータ規模で言えばもはや100メートル短距離走ではなく、産業界連携のリレー競争となっている。 |
Leap Agent エコシステムが初めて公開されました。携帯電話、自動車、IoT、ロボットをカバーし、数千の業界に急速に導入されています。
関連するおすすめ記事
-
CCFプログラマーカンファレンスの全スケジュールが公開されました。ぜひご登録の上、ダリでご参加ください!
-
ECCV 2024に選出!MITは54,000枚以上の画像をカバーし、SAMを上回る医用画像セグメンテーションの汎用モデルであるScribblePromptを提案しています。
-
2024年Rust Chinaカンファレンスの登録リンクと、最初の一連のエキサイティングなプレゼンテーショントピックの紹介(記事の最後にプレゼントがあります)
-
中国で最も美しいCTOが宝定の伝説の車を披露。中国のスマートカーがラスベガスに集結 | CES 2025
-
レノボグループの第1四半期純利益は65%急増し、AI PCの出荷台数は前四半期比228%増加した。
-
化学のチューリングマシンを目指して!AI搭載製薬会社Chemifyが世界初の化学コンパイラーを開発、米国市場に進出。