|
データホエール データホエールコンペティション 主催:Alibaba Cloud、NVIDIA 現在、大規模モデルの学習データの大部分はインターネット上の情報から得られています。しかし、大規模モデルの規模と性能が徐々に向上するにつれて、インターネット上で利用可能な膨大なデータは最終的に枯渇します。さらに、マルチモーダルな大規模モデルの場合、これらのリソースを大規模モデルの学習に適したレベルにまで引き上げるには、相当な追加処理と手動によるアノテーションが必要になります。そのため、限られた計算リソース内で、既存の強力な大規模モデルを用いて、新しいモデルの学習プロセスに必要な高品質な学習データを効率的に合成する方法が、新たな重要な課題となっています。 Alibaba Cloud と NVIDIA が主催し、Alibaba Cloud Tianchi Platform、Moda Community、Alibaba Tongyi Lab が共催する、第 4 回 Data-Juicer データ チャレンジ ( Tianchi Better Synth マルチモーダル大規模モデル データ合成チャレンジ)が正式に始まりました。 01 トーナメント紹介🎉 今回は新たな助っ人が加わりました。生データを自らクリーニングするだけでなく、既存の大規模モデルの創造力を活用して、新たな魅力的な要素を合成・創造し、成長を続けるマルチモーダル大規模モデルが、これらの先行モデルによって革新的に合成されたデータの珍味を吸収し、発展させることができるかどうかを探る必要があります。 おいしい料理の創作と生産をさらに強化するために、Data-Juicer は、BLIP-2 モデルに基づく画像からテキストへの演算子や、安定拡散モデルに基づくテキストから画像/テキストから画像への演算子など、便利なマルチモーダルデータ合成ツールと演算子を幅広く提供しています。これらのツールを使用すると、すぐに開始して、一連の革新的な材料を合成し、データ駆動型レシピを通じて料理に組み込むことができます。さらに、NVIDIA のオープンソースの大規模言語モデル推論アクセラレーションライブラリ TensorRT-LLM と、最近リリースされた NVIDIA TensorRT 10.0 によって提供される包括的なモデル最適化ライブラリ TensorRT-Model-Optimizer のおかげで、オフラインの参加者は、大規模モデルを使用して大量の高品質データを合成する際の効率を最大化する方法を探り、データ合成戦略を迅速に反復することができます。 コンテストウェブサイト: https://tianchi.aliyun.com/co... 02 賞🏆 * * このコンテストの賞金総額は130,000人民元(税抜)で、詳細は次のとおりです。 🥇優勝者(1位): 賞金50,000人民元と賞状が授与されます。 🥈準優勝(2位~3位): 賞金20,000人民元と賞状が授与されます。 🥉第3位(4位~6位): 賞金10,000人民元と賞状が授与されます。 優秀賞(7位~10位) 賞金2,500元と賞状が授与されます。 記念賞:オフラインコンテストの出場資格を得た参加者全員に、主催者が提供するスマート充電器やミニ電動パズルなどの記念品が贈られます。 参加賞:オンラインコンテストで11位から40位にランクインしたチームの各メンバーには、Alibaba CloudティーセットまたはPaipaiランプが贈られます。 共有賞:コミュニティにソリューションを投稿し、レビューに合格したチームには、チームメンバーごとに 1 つの Tmall Genie Fangtang が贈られます。 03 イベントの共有と交換👬🏻 Datawhale では、誰でも学んで参加できる、よりシンプルで使いやすいトーナメント ガイドも開発しました。さらに、チームメイトを探したり、トーナメントのテクニックを交換したりするために、トーナメントのディスカッション グループに参加することもできます。 👇コンテストディスカッショングループに参加する👇 Data-Juicer オープンソースコード: https://github.com/modelscope... Datawhale コンペティションのウォークスルー: https://datawhaler.feishu.cn/... 👇イベントに登録するには、クリックして元の記事を読んでください。 |
Alibaba CloudとNVIDIAが主催する、賞金総額13万元の大規模モデルコンテスト!
関連するおすすめ記事
-
これはテスラ ロボタクシーを巡る最大の論争です…
-
o1 のリリース後の最も有益な円卓討論会: Yang Zhilin、Jiang Daxin、Zhu Jun が大規模モデルの技術的な道筋を探りました。
-
今すぐ5090をチェックしてください!Nvidiaは、一部のグラフィックカードにROPが欠落しており、Nintendo Switchなどの古いデバイスでのゲームプレイに影響を与えるという欠陥を正式に確認しました。
-
Zhihuijun氏とYushu氏に続き、オープンソースも登場しました。LeRobotを用いて学習・テストされたロボット操作データセットが公開されました。ネットユーザーからは「タイパンツ、ホット!」というコメントが寄せられています。
-
学部生と大学院生のための最後の AI サマーキャンプがやって来ます!
-
Metaの新しいビデオ生成フレームワークは、逆立ちアクロバットを完璧に処理し、デュエットの完璧な同期も実現します。モーションの一貫性は約20%向上し、DiTモデルとのシームレスな統合も可能です。