618ZXW

Meta初のマルチモーダル大規模モデルがワンクリックで起動できます!3万枚以上の画像を含む、初のマルチニードル刺繍データセットがオンラインになりました。

Meta Connect 2024の基調講演で、ザッカーバーグ氏は初のマルチモーダル大規模モデルとなるLlama 3.2ビジョンのリリースを発表しました。このモデルには11Bと90Bの2つのバージョンがあり、マルチモーダルタスクをサポートする最初のLlamaモデルの1つとなります。公式データによると、これら2つのオープンソースモデルのパフォーマンスは、クローズドソースモデルを上回っています。

すでにデプロイ済みで、hyper.aiのウェブサイトで11Bモデルのワンクリックデプロイチュートリアルを公開しました。ぜひ皆さんも、このチュートリアルの考察とテストにご参加ください!

オンラインで実行: https://go.hyper.ai/DKGzm

9月23日から9月27日までのhyper.ai公式ウェブサイトの更新の概要は次のとおりです。

  • 高品質の公開データセット: 10
  • 厳選された高品質のチュートリアル:2
  • 選択されたコミュニティ記事: 3
  • 人気の百科事典の項目: 5
  • 10月締め切りのトップカンファレンス:7

公式サイトをご覧ください: hyper.ai

選択された公開データセット

1. MSEmbGAN マルチニードル刺繍データセット

このデータセットは、単針および多針のラベルが詳細に記述された初の刺繍データセットです。刺繍画像とそれに対応するコンテンツ画像を含む30,000枚以上の画像は、プロ仕様の刺繍ソフトウェア(Wilcom 9.0)を使用して作成されました。本論文は、構築された多針刺繍データセットをこの分野の他の研究者に提供するものです。

直接使用する: https://go.hyper.ai/urNGE

2. 映画データセット

このデータセットには、MovieLens データセット全体から抽出した、2017 年 7 月以前に公開された 45,000 本の映画の詳細なメタデータが含まれています。ポスター、背景、予算、収益などの基本情報だけでなく、公開日、言語、原産国、制作会社などの詳細情報も含まれています。

直接使用する: https://go.hyper.ai/SDwXX

3. Open X-Embodiment リアルロボットデータセット

このデータセットは、単腕ロボットから二足歩行ロボット、四足歩行ロボットまで、21の異なる機関が共同で収集した22種類のロボットのデータを集約したもので、527種類のスキルと160,266のタスクを網羅しています。世界34のロボット研究機関から提供された60の既存ロボットデータセットを集約することで構築され、多種多様なロボットタスクと環境を網羅しています。

直接使用する: https://go.hyper.ai/Cqlw6

4. TMDB 5k映画データセット

このデータセットには、主にアメリカ合衆国で制作された1世紀(1916年から2017年)にわたる5,000本の映画に関する詳細な情報が含まれています。このデータセットは、研究者やアナリストが映画業界のトレンドや投資機会を探り、新規参入者へのガイダンスを提供することを目的としています。

直接使用する: https://go.hyper.ai/zaRFY

5. LongCite-45k 大規模モデル細粒度拡張データセット

このデータセットには、文レベルの引用を含む 44,600 件の高品質な質問と回答のデータ エントリが含まれており、最大 128,000 トークンの長いテキスト処理をサポートし、きめ細かな文レベルの引用を生成することで、ユーザーがモデルの回答の正確性を検証できるようにします。

直接使用する: https://go.hyper.ai/omO5f

6. TMDB映画データセット(2024年版)

TMDb (映画データベース) は、TMDB データベースの 1,000,000 本の映画コレクションを含む包括的な映画データベースであり、タイトル、評価、公開日、収益、ジャンル、その他の詳細を含む映画の情報を提供します。

直接使用する: https://go.hyper.ai/r9ks2

7. InfiMM-WebMath-40B マルチモーダル数学推論データセット

このデータセットは、数学的推論タスク向けに特別に設計された、大規模でオープンソースのマルチモーダルデータセットです。2,400万件のウェブページ、8,500万件の関連画像URL、そして400億のトークンが含まれており、これらはすべてCommonCrawlデータベース(2019~2023年)から慎重に抽出・フィルタリングされています。

直接使用する: https://go.hyper.ai/P8m9l

8. VoiceAssistant-40万音声アシスタント最適化データセット

VoiceAssistant-400K は、音声アシスタント向けに特別に最適化されたデータセットであり、モデルが音声アシスタント サービスを提供する際にコード シンボルの生成を削減できるように設計されており、実際のアプリケーションでのモデルの実用性を高めます。

直接使用する: https://go.hyper.ai/KGIM0

9. 歴代音楽アルバムレビューデータセットのトップ5,000アルバム

このデータセットには、http://rateyourmusic.com コミュニティのユーザー投票による、歴代最も人気のあるアルバム上位5,000枚が含まれています。このデータセットは2021年10月12日にウェブスクレイピングによって取得され、ランキング、アルバム名、アーティスト名、リリース日、ジャンル、説明、平均評価、評価数、レビュー数などの属性が含まれています。

直接使用する: https://go.hyper.ai/c4Olt

10. Spotifyデイリートップ200曲音楽トレンドデータセット

このデータセットには、2017年から2021年までの世界中のSpotifyのトップ200曲の毎日のリストが含まれています。350,000曲以上を網羅したこのデータセットは、研究者や音楽愛好家に、トレンド、音楽の好み、その他の関連研究を分析するための豊富な情報を提供します。

直接使用する: https://go.hyper.ai/afvbK

その他の公開データセットについては、以下をご覧ください。

https://hyper.ai/datasets

厳選された公開チュートリアル

1. Llama-3.2-11B-Vision-Instructのワンクリック展開

このモデルは、Llama 3.2-Visionマルチモーダル大規模モデルシリーズの11Bパラメータサイズであり、高解像度画像入力(1120x1120ピクセル)をサポートし、クロスアテンションメカニズムを用いてベースモデルとのチャットバリアントを補完・調整します。公式サイトからコンテナをクローンして起動し、APIアドレスをコピーするだけで、モデルによる推論を体験できます。

直接使用する: https://go.hyper.ai/DKGzm

2. ComfyUl Littletinies 童話イラストジェネレーター デモ

このモデルは、テキストプロンプトに基づいて手描き風の漫画風画像を生成できます。特に、古典的な漫画の美学を取り入れた、気まぐれで様式化されたイラストを作成するのに適しており、手描き風の質感、滑らかな筆致、柔らかな色調の画像を生成します。モデルと環境はすでにデプロイされているので、チュートリアルの指示に従うだけで推論と生成を開始できます。

直接使用する: https://go.hyper.ai/YHu0a

安定拡散チュートリアルのディスカッショングループも作成しました。QRコードをスキャンして、メッセージに「SD Tutorial」と入力してグループに参加し、様々な技術的な問題について議論したり、アプリケーションの結果を共有したりしてください。

厳選されたコミュニティ記事

1. 刺繍パターンのインテリジェント生成!武漢紡織大学のビジュアルコンピューティングとデジタルテキスタイルチームは、初のマルチステッチ刺繍生成敵対ネットワークモデルを発表し、トップジャーナルTVCGに採択されました。

武漢紡織大学コンピュータサイエンス・人工知能学院の胡新栄教授の研究グループは、マルチステッチ刺繍のための生成的敵対的ネットワークモデル(Generative Adversarial Network Model:MSEmbGAN)を提案し、これまでで最大の刺繍データセットを作成しました。彼らの論文は、トップジャーナルであるTVCGにも採択されました。本稿では、この論文の詳細な解釈と共有を行います。

完全な概要を見る: https://go.hyper.ai/5t8NQ

2. 権威ある学術誌「Cell Discovery」に新たな研究成果が掲載されました!上海交通大学のHong Liang氏率いるチームが、機能性タンパク質を超低コストで完全自動設計できるCPDiffusionモデルを提案しました。

上海交通大学のHong Liang氏率いるチームは、タンパク質配列、構造、機能間の暗黙的なマッピング関係を非常に低いトレーニングコストとデータコストで学習し、多様なタンパク質配列を生成できる拡散確率モデルフレームワークを設計しました。本稿では、彼らの論文の詳細な解釈と共有を提供します。

完全なレポートを見る: https://go.hyper.ai/ziRvz

3. ECCV 2024に選出!MITは54,000枚以上の画像をカバーし、SAMを上回る性能を誇る医療画像セグメンテーションの汎用モデル「ScribblePrompt」を提案しました。

MITコンピュータサイエンス・人工知能研究所のチームは、マサチューセッツ総合病院およびハーバード大学医学部の研究者と共同で、インタラクティブな生物医学画像セグメンテーションのための汎用モデル「ScribblePrompt」を提案しました。このニューラルネットワークベースのセグメンテーションツールにより、アノテーターは描画、クリック、バウンディングボックスといった様々なアノテーション手法を用いて、学習されていないラベルや画像の種類であっても、生物医学画像セグメンテーションタスクを柔軟に実行できます。本稿では、この論文の詳細な解釈と共有を提供します。

レポート全文はこちら:https://go.hyper.ai/QQjAf

人気のある百科事典の項目

1. シグモイド関数

2. 対応のあるt検定

3. 対照学習

4. 半教師あり学習

5. データ拡張

この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。

https://go.hyper.ai/wiki

トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event

今週のエディターズピックはこれで終了です。hyper.ai公式サイトに掲載してほしいリソースがありましたら、ぜひコメントを残していただくか、作品をご提出ください。

来週お会いしましょう!

HyperAI (hyper.ai) について

HyperAI(hyper.ai)は、中国を代表する人工知能(AI)および高性能コンピューティング(Hyper.ai)コミュニティであり、中国のデータサイエンス分野のインフラとなることを目指し、国内の開発者向けに豊富で高品質な公開リソースを提供しています。これまでに以下の実績があります。

  • 1300以上の公開データセットの国内高速ダウンロードノードを提供
  • 400以上の古典的かつ人気のあるオンラインチュートリアルが含まれています
  • 100以上のAI4Science論文事例を理解する
  • 500 以上の関連用語の検索をサポートします。
  • 中国で初めて Apache TVM の完全な中国語ドキュメントをホスト

公式ウェブサイトにアクセスして学習を始めましょう:

https://hyper.ai/