618ZXW

Alibaba CloudとNVIDIAが主催する、賞金総額13万元の大規模モデルコンテスト!

データホエール

データホエールコンペティション

主催:Alibaba Cloud、NVIDIA

現在、大規模モデルの学習データの大部分はインターネット上の情報から得られています。しかし、大規模モデルの規模と性能が徐々に向上するにつれて、インターネット上で利用可能な膨大なデータは最終的に枯渇します。さらに、マルチモーダルな大規模モデルの場合、これらのリソースを大規模モデルの学習に適したレベルにまで引き上げるには、相当な追加処理と手動によるアノテーションが必要になります。そのため、限られた計算リソース内で、既存の強力な大規模モデルを用いて、新しいモデルの学習プロセスに必要な高品質な学習データを効率的に合成する方法が、新たな重要な課題となっています。

Alibaba Cloud と NVIDIA が主催し、Alibaba Cloud Tianchi Platform、Moda Community、Alibaba Tongyi Lab が共催する、第 4 回 Data-Juicer データ チャレンジ ( Tianchi Better Synth マルチモーダル大規模モデル データ合成チャレンジ)が正式に始まりました。

01

トーナメント紹介🎉

今回は新たな助っ人が加わりました。生データを自らクリーニングするだけでなく、既存の大規模モデルの創造力を活用して、新たな魅力的な要素を合成・創造し、成長を続けるマルチモーダル大規模モデルが、これらの先行モデルによって革新的に合成されたデータの珍味を吸収し、発展させることができるかどうかを探る必要があります。

おいしい料理の創作と生産をさらに強化するために、Data-Juicer は、BLIP-2 モデルに基づく画像からテキストへの演算子や、安定拡散モデルに基づくテキストから画像/テキストから画像への演算子など、便利なマルチモーダルデータ合成ツールと演算子を幅広く提供しています。これらのツールを使用すると、すぐに開始して、一連の革新的な材料を合成し、データ駆動型レシピを通じて料理に組み込むことができます。さらに、NVIDIA のオープンソースの大規模言語モデル推論アクセラレーションライブラリ TensorRT-LLM と、最近リリースされた NVIDIA TensorRT 10.0 によって提供される包括的なモデル最適化ライブラリ TensorRT-Model-Optimizer のおかげで、オフラインの参加者は、大規模モデルを使用して大量の高品質データを合成する際の効率を最大化する方法を探り、データ合成戦略を迅速に反復することができます。

コンテストウェブサイト: https://tianchi.aliyun.com/co...

02

🏆 * *

このコンテストの賞金総額は130,000人民元(税抜)で、詳細は次のとおりです。

🥇優勝者(1位):

賞金50,000人民元と賞状が授与されます。

🥈準優勝(2位~3位):

賞金20,000人民元と賞状が授与されます。

🥉第3位(4位~6位):

賞金10,000人民元と賞状が授与されます。

優秀賞(7位~10位)

賞金2,500元と賞状が授与されます。

記念賞:オフラインコンテストの出場資格を得た参加者全員に、主催者が提供するスマート充電器やミニ電動パズルなどの記念品が贈られます。

参加賞:オンラインコンテストで11位から40位にランクインしたチームの各メンバーには、Alibaba CloudティーセットまたはPaipaiランプが贈られます。

共有賞:コミュニティにソリューションを投稿し、レビューに合格したチームには、チームメンバーごとに 1 つの Tmall Genie Fangtang が贈られます。

03

イベントの共有と交換👬🏻

Datawhale では、誰でも学んで参加できる、よりシンプルで使いやすいトーナメント ガイドも開発しました。さらに、チームメイトを探したり、トーナメントのテクニックを交換したりするために、トーナメントのディスカッション グループに参加することもできます。

👇コンテストディスカッショングループに参加する👇

Data-Juicer オープンソースコード:

https://github.com/modelscope...

Datawhale コンペティションのウォークスルー:

https://datawhaler.feishu.cn/...

👇イベントに登録するには、クリックして元の記事を読んでください