|
12月28日、上海は既に初冬を迎えていましたが、寒さも聴衆の熱意を冷ますことはできませんでした。会場は満員で、交流の雰囲気は活気に満ちていました。業界の課題から技術革新、応用シナリオから実践的な成果まで、講演者と聴衆はAIコンパイラーをめぐる深遠な「知恵比べ」を繰り広げました。 WeChat公式アカウント「HyperAI超神经」をフォローし、キーワード「1228 AI Compiler」を返信すると、講演者の完全なPPTを入手できます。 このミートアップは2部に分かれており、技術共有セッションでは、Horizon Robotics、AIZ、ByteDance、Lingchuan Technologyの4名のコンパイラ上級エキスパートが、それぞれのチームの最新の研究成果を発表しました。また、豊富な応用例を用いて、これらの成果の応用プロセスと実際の問題解決への効果を分かりやすく解説しました。 革新的なコンパイラ アーキテクチャ設計から特定のシナリオでのパフォーマンス最適化戦略、他のテクノロジとの統合とアプリケーションまで、講演者のプレゼンテーションではコンパイラ分野の多くの重要な側面が取り上げられ、参加者に深い業界洞察と貴重な実践経験が提供されました。 ラウンドテーブルディスカッションでは、上海交通大学およびApache TVM PMCの馮思源博士がモデレーターを務めました。馮博士と4人の講演者は、「コンピューティング、ネットワーキング、ソフトウェア、アルゴリズム、そしてエコシステムの相乗的発展」という中核テーマに焦点を当て、包括的かつ多角的な意見交換を行いました。聴衆は積極的に参加し、それぞれの知見を共有し、講演者と意見交換を行いました。 イベントレビュー以下は、共有されたコンテンツの概要とイベントのビデオ要約です。 トピック: Transformer モデルのコンパイルと展開の最適化プラクティス 概要:近年、TransformerモデルはLLM分野で目覚ましい成果を上げているだけでなく、コンピュータビジョンにも広く応用されています。自動運転のシナリオでは、Transformerモデルのコンパイルとデプロイメントの最適化は複雑なプロセスです。エンドツーエンドモデルとVLMは、エッジでのコンパイル、最適化、デプロイメントに大きな課題をもたらします。本プレゼンテーションでは、主にHorizon Roboticsのこの分野における実践と経験の一部を紹介します。 このプレゼンテーションを視聴することで、次のことが学べます。
ビデオを共有: https://www.bilibili.com/video/BV1wN6pYgEyi/?spm_id_from=333.999.0.0 トピック:FlagGems:研究開発の進捗とエコシステムアプリケーションの探索 概要:バージョン2.0のリリース以来、Zhiyuanチーム、パートナーメーカー、そしてTriton Chinaコミュニティとの緊密な連携により、FlagGemsはサポートする演算子の数、計算性能、コード生成、ランタイムメカニズムといった分野において、研究開発において大きな進歩を遂げてきました。同時に、FlagGemsは業界の上流と下流を繋ぎ、大規模モデルのトレーニングと推論適応、マルチバックエンドチップ統合といった分野における革新的な探求を進め、多様なエコシステムにおける演算子ライブラリの応用シナリオをさらに拡大しています。 このプレゼンテーションを視聴することで、次のことが分かります。
ビデオを共有: https://www.bilibili.com/video/BV1Le6JYXEuR/?spm_id_from=333.999.0.0 トピック:計算・メモリアクセス・通信最適化の観点からのAIコンパイラ設計 概要:AIチップ向けコンパイラ最適化は、計算、メモリアクセス、通信という3つの主要な課題に直面しています。本レポートでは、これら3つの分野におけるAIコンパイラの設計と最適化の経験を共有します。計算の観点からは、カスタマイズされたアクセラレーションユニットの最適化、メモリアクセスの観点からは、AIチップ向けのメモリアクセスモデリングと最適化、そして通信の観点からは、計算と通信の融合における経験と進歩を共有します。 このプレゼンテーションを視聴することで、次のことが分かります。
ビデオを共有: https://www.bilibili.com/video/BV1vX6EYDEkm/?spm_id_from=333.999.0.0 2025 AIコンパイラーに会う · 乞うご期待2023年から2024年にかけて、北京、上海、深圳で計6回のオフラインミートアップを成功裏に開催し、数千人の経験豊富な専門家や愛好家を集め、豊かなコミュニティエコシステムを構築しました。2025年には、AIコンパイラーの都市マップを継続的に拡張し、企業やコミュニティパートナーの皆様に、様々な形で共創への参加を心からお誘いいたします。講演者の推薦、会場の提供、軽食の提供など、皆様のご参加をお待ちしております。 中国で最も活発なAIコンパイラコミュニティを一緒に築きましょう!最後に、イベントの集合写真をご紹介します❤️ 主催者とパートナーHyperAIは、中国をリードするAIおよび高性能コンピューティング(HyperAI)コミュニティです。中国のデータサイエンスおよびAI業界の開発者や愛好家が、データセットの高速ダウンロード、オンラインチュートリアル、詳細な論文分析、主要カンファレンスカレンダーの統合などを通じて、AIを学び、理解し、実践できるよう支援することを目指しています。コミュニティと共に、AIの未来を築き上げていきましょう。現在、HyperAIのウェブサイトには、数千もの古典的で高品質な公開データセットとチュートリアルが掲載されており、中国で最も活発なAIコンパイラーコミュニティの一つを運営しています。 公式サイトをご覧ください:https://hyper.ai/ OpenBayesは、中国を代表する高性能コンピューティングサービスプロバイダーです。従来のソフトウェアエコシステムと機械学習モデルを次世代ヘテロジニアスチップと統合することで、産業界や大学の研究機関向けに、より高速で使いやすいデータサイエンスコンピューティング製品を提供しています。同社の製品は、数十もの大規模な産業シナリオや主要な研究機関に採用されています。 公式サイトをご覧ください:https://openbayes.com/ MLC.AIコミュニティは2022年6月に設立されました。機械学習分野の著名な若手学者であり、Apache TVMの主な発明者であるChen Tianqi氏が率いるチームは、機械学習コンパイルの主要な要素とコアコンセプトを体系的に紹介するMLCオンラインコースを開始しました。 2022年11月、MLC.AIコミュニティのボランティアの共同の努力により、TVMの最初の完全な中国語ドキュメントが公開され、HyperAIウェブサイトで正常にホストされました。これにより、機械学習コンパイルに関心のある国内開発者に、新しいテクノロジーにアクセスして学習するための基本設定(ドキュメント)がさらに提供されました。 MLCオンラインコース:https://mlc.ai/ TVM 中国語ドキュメント: https://tvm.hyper.ai/ 上海五角場イノベーション・起業学院は、楊浦区政府、著名な大学、業界をリードする企業、そしてイノベーションサービス機関が共同で設立した非営利の教育・サービス機関です。「イノベーションと起業をより容易に成功させるための深いつながりを築く」という使命を掲げ、起業家と支援者を結びつけ、イノベーションと起業のための資源配分の効率を高め、創造性を促進しています。 2022年11月、五角場イノベーションアカデミーは正式にパブリックスペースをオープンし、起業家やイノベーターに800平方メートルのスペースを開放しました。アカデミーは、香港中文大学上海センターや水安グループなどのパートナーと協力し、起業とイノベーションのための公共福祉ブランド「アカデミーカフェ」を立ち上げました。起業とイノベーションのための公共福祉サービスに共感するKOL、企業、社会団体を「公共福祉パートナー」として招き、起業家が集う様々な場を共同で設計しています。「アカデミーカフェ」はこれまでに140以上の起業とイノベーションをテーマにしたイベントを開催し、3,000人以上が参加しました。 イベントサポートPPT を入手する: WeChat 公式アカウント「HyperAI超神经」をフォローし、キーワード「1228 AI Compiler」を返信して、講演者の完全な PPT を入手してください。 |
イベントの概要 | 2024 Meet AI Compiler が成功裏に終了: コンピューティング、ネットワーク、ソフトウェア、アルゴリズム、エコシステムの共同開発!
関連するおすすめ記事
-
Nvidia は記録破りの利益で DeepSeek に応えました。年間収益は 9,500 億ドルで、リリース直後に Blackwell が 800 億ドルを貢献しました。
-
[Triton チュートリアル] 融合ソフトマックス(Fused Softmax)
-
中国情報通信研究院(CAICT)が、2024 年の信頼できるオープンソース評価の結果を発表しました。
-
オンラインチュートリアル | 宿題を急いで終わらせたい小学生にとって、DeepSeekは必須アイテムでしょうか?「サーバーがビジー状態」にさよならする方法をステップバイステップで学びましょう。
-
清華大学のオープンソース混合精度推論システム MixQ は、大規模モデルのほぼロスレスな量子化を実現し、推論スループットを向上させます。
-
Claude 3.7 を使用した実際のテスト: 一度に 3,200 行のコードが出力され、物理法則の習得が実証されました。愚か者たちはすでに制御を失っています。