|
大規模言語モデル (LLM) が急成長を遂げる時代において、大規模マルチタスク言語理解 (MMLU) などのベンチマークは、さまざまな領域にわたる AI の言語理解および推論機能を限界まで押し上げる上で重要な役割を果たします。 しかし、モデルの継続的な改善と最適化により、これらのベンチマークテストにおける LLM のパフォーマンスは徐々に安定し、異なるモデルの機能の違いを区別することがますます困難になってきました。 LLMの能力をより適切に評価するため、ウォータールー大学、トロント大学、カーネギーメロン大学の研究者が共同でMMLU-Proデータセットを公開しました。このデータセットは、オリジナルのMMLUデータセット、STEMウェブサイト、TheoremQA、SciBenchなど、複数のソースからの質問を統合しています。このデータセットは現在hyper.aiからダウンロード可能です。リンクは下にスクロールしてください。 9月9日から9月14日までのhyper.ai公式ウェブサイトの更新の概要は次のとおりです。
公式サイトをご覧ください:hyper.ai 選択された公開データセット1. MMLU-Pro大規模マルチタスク理解データセットMMLU-Proデータセットは、大規模言語モデルの能力を厳密にベンチマークするために設計された、より強力で挑戦的な大規模マルチタスク理解データセットです。このデータセットには、様々な分野にわたる12,000件の複雑な質問が含まれています。 直接使用する: https://go.hyper.ai/PwJDW 2. DeepGlobe18道路抽出データセット道路チャレンジのトレーニングデータには、1024×1024ピクセルのRGB衛星画像6,226枚が含まれています。これらの画像は50cmピクセルの解像度を持ち、DigitalGlobe社の衛星によって収集されました。 直接使用する: https://go.hyper.ai/VIg0J 3. OpenForensics 顔偽造検出データセットこのデータセットは、115,000枚のフィールド画像と334,000枚の顔画像で構成されています。すべての画像には、偽造カテゴリ、バウンディングボックス、セグメンテーションマスク、偽造境界、一般的な顔の特徴など、豊富な顔アノテーションが付与されています。また、様々な背景、年齢、性別、ポーズ、場所、そして遮蔽された顔など、複数の人物が含まれています。 直接使用する: https://go.hyper.ai/jTTRz 4. DeepfakeTIMITディープフェイク検出データセットこのデータセットには、敵対的生成ネットワーク(GAN)に基づくオープンソース手法を用いて顔を入れ替えた動画が含まれています。これらの動画は、オリジナルのオートエンコーダに基づくディープフェイクアルゴリズムを使用して作成されています。 直接使用する: https://go.hyper.ai/me1TI 5. SESYD合成文書データベースこのデータセットには、ベンチマークとなる実情報を持つ文書画像が含まれており、284,000枚の画像、190,000個のシンボル、284,000個の文字を含む11セットで構成されており、主に文書画像分析分野における2つの主要な研究課題を対象としています。(1)オンライン描画画像(間取り図や回路図など)におけるシンボルの認識と位置特定、(2)地図における文字の分割と認識。 直接使用する: https://go.hyper.ai/ZqRTQ 6. LAV-DF マルチモーダルディープフェイクオーディオビジュアルデータセットLAV-DF は、VoxCeleb2 データセットから派生したマルチモーダル (ビデオとオーディオの操作) データセットで、136,304 本のビデオが含まれており、そのうち 36,431 本は実際のビデオ、99,873 本は偽のビデオです。 直接使用する: https://go.hyper.ai/ujock 7. 活気のある服のレンタルデータセットこのデータセットには、64,000件の取引、2,2000人の匿名ユーザーのレンタル履歴、そして15,800点のユニークな衣服が含まれており、それぞれの衣服の属性とレンタル履歴に関する詳細な情報が含まれています。すべての衣服は、個々のアイテム、または個々のアイテムに共通するデザインを示す対応するグループとしてリストされており、各衣服には特定の属性を説明する一連のタグが付与されています。 直接使用する: https://go.hyper.ai/PFlKA 8. FFIW10K 顔認証データセットこのデータは、YouTubeから収集された1万本の高品質なフェイク動画で構成されており、1フレームあたり平均3つの顔が含まれています。各動画には、複雑な現実世界のシナリオに近づけた、本物の顔とフェイクの顔の両方が含まれています。操作プロセスは完全に自動化されており、ドメイン敵対的品質評価ネットワークによって制御されているため、データセットは非常にスケーラブルで、人間の介入を最小限に抑えることができます。 直接使用する: https://go.hyper.ai/AHS7y 9. ForgeryNet 顔認証データセットこのデータセットには、290万枚の画像と221,247本の動画が含まれており、世界中の7つの画像レベルと8つの動画レベルのなりすまし手法を網羅しています。研究者にとって、画像と動画レベルにおける4つのタスク(画像なりすましの分類、空間なりすましの特定、動画なりすましの分類、時間なりすましの特定)をサポートするための豊富なリソースとなります。 直接使用する: https://go.hyper.ai/Yx0mj 10. EEG Eve Stateデータセット(眼の脳波)このデータセットには、EEG測定のインスタンスが含まれており、その出力は目が開いているか閉じているかを示します。データセット内の値は時系列に並べられており、0は目が開いていること、1は目が閉じていることを表します。データセットには、AF3、F7、F3、FC5、T7、P、O1、O2、P8、T8、FC6、F4、F8、AF4とラベル付けされた14個のEEG測定が含まれています。 直接使用する: https://go.hyper.ai/RTBDy その他の公開データセットについては、以下をご覧ください。 https://hyper.ai/datasets 厳選された公開チュートリアル1. DeepSeek-Prover-V1.5のワンクリック展開このモデルは、DeepSeekが2024年にオープンソース化した数学定理証明モデルです。研究チームはこのモデルをLean 4に導入し、自己反復とLean証明者による監督を通して、囲碁風の学習環境を構築します。このチュートリアルは、このモデルをワンクリックでデプロイするための手順を段階的に説明したものです。 直接使用する: https://go.hyper.ai/MevMB 2. LLaVA OneVision マルチモーダル全周ビジョン モデルのデモこのモデルは画像、テキスト、画像とテキストのインターリーブ入力、そして動画を処理でき、これら3つの重要なコンピュータービジョンシナリオにおいて、オープンマルチモーダルモデルのパフォーマンスボトルネックを同時に克服した初の単一モデルです。公式ウェブサイトからコンテナをクローンして起動し、APIアドレスをコピーするだけで、モデルを使った推論を体験できます。 直接使用する: https://go.hyper.ai/Dcg74 3. オンラインチュートリアル | 大人の皆さん、テキストベースのグラフィックの時代がまた変わりました!SDコアメンバーが独自のスタジオを立ち上げ、最初のモデルであるFLUX.1でSD 3やMidjourneyと競い合っています。テキストベースの画像生成における競争が激化しています!Stable Diffusionの元コアメンバーが、商用利用とオープンソースの個人利用の両方に対応した独自のテキストベースの画像生成モデル「FLUX」をリリースしました。生成される画像は実写写真に非常に近く、驚くほどリアルなディテールを備えています。hyper.aiはすでに「FLUX ComfyUI(LoRAトレーニング版Black Myth: Wukongを含む)」をリリースしており、以下のリンクをクリックしてチュートリアルに従うだけでデプロイできます。 直接使用する: https://go.hyper.ai/trQhv 厳選されたコミュニティ記事1. データセットの編集 | DeepFake Chaos: 魔法に魔法で対抗!高品質なデータセットは、偽造検出技術の開発に役立ちます。顔認識とディープフェイク検出をめぐる蔓延する問題に対処するには、改ざんされた画像や動画を正確に識別できる顔認識・偽造検出技術の高度化が急務となっています。HyperAIは、一般的に使用されている顔認識とディープフェイクのデータセット11種類をまとめ、ワンクリックでダウンロードできるようにしました。 完全な概要を見る: https://go.hyper.ai/EMKo2 2. 深夜にAppleの知能が爆発!Appleが自社開発チップ4種をリリース、iPhone/iWatch/AirPodsが大幅アップグレード。Appleは9月10日に開催された秋の製品発表イベントで、iPhone 16、AirPods 4、Apple Watch Series 10などの新製品を発表しました。自社製チップを搭載したこれらの製品は、パフォーマンスが大幅に向上し、Apple Intelligenceと完全に統合されているため、ユーザーにかつてないインテリジェントな体験を提供します。この記事では、Appleの秋の製品発表イベントを包括的に解説します。 レポート全文はこちら:https://go.hyper.ai/H7P8X 3. 香港中文大学、復旦大学、イェール大学などが共同で提案した新しいタンパク質相同性検出法は、感度が56%向上します。タンパク質同定のプロセスにおいて、タンパク質配列の相同性判定は極めて重要な課題です。タンパク質の遠距離相同性研究における課題に対処するため、香港中文大学の李宇(Yu Li)氏は、復旦大学知能複雑系研究所および上海人工知能研究所の若手研究者である孫思奇(Siqi Sun)氏、そしてイェール大学のマーク・ガースタイン氏と共同で、タンパク質言語モデルと高密度検索技術に基づく超高速・高感度な相同性検出フレームワーク「Dense Homology Finder」を提案しました。本稿では、彼らの研究論文を詳細に解説し、その概要を紹介します。 レポート全文はこちら:https://go.hyper.ai/vLAej 4. 北京師範大学のチームは、2,500平方キロメートルの実際のデータに基づいて、高空間解像度の画像予測を実現する StarFusion モデルを提案しました。北京師範大学地表プロセス・資源生態国家重点実験室の陳金氏率いるチームは、デュアルストリーム時空間分離・融合アーキテクチャモデル「StarFusion」を提案しました。このモデルは、既存のディープラーニングアルゴリズムのほとんどが学習にHSR時系列画像を必要とするという問題を克服し、高空間解像度画像の予測を完全に実現します。本稿では、この研究論文の詳細な解釈と共有を提供します。 レポート全文はこちら:https://go.hyper.ai/7LmzA 人気のある百科事典の項目
この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。 https://go.hyper.ai/wiki トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event HyperAI (hyper.ai) についてHyperAI(hyper.ai)は、中国を代表する人工知能(AI)および高性能コンピューティング(Hyper.ai)コミュニティであり、中国のデータサイエンス分野のインフラとなることを目指し、国内の開発者向けに豊富で高品質な公開リソースを提供しています。これまでに以下の実績があります。
公式ウェブサイトにアクセスして学習を始めましょう: https://hyper.ai |
MMLU-Proベンチマークデータセットが利用可能になりました。難易度と課題がさらに高まった、12,000点の複雑な学際的問題が含まれています。DeepSeekの数理モデルはワンクリックで展開できます。
関連するおすすめ記事
-
なぜほとんどのプログラマーは独立した開発を行わないのでしょうか?
-
山と海を越えて、家路へ!第二世代のHaval H9は、「ファミリーオフロード車」という新たなカテゴリーを切り開きます。
-
Doubao チームはビデオ生成において画期的な進歩を達成しました。言語モデルを必要とせず、「視覚」のみに基づいて複雑なタスクを学習します。
-
GoogleがTPUの秘密兵器「AlphaChip」を公開、Nature誌に掲載!AIチップ設計の発展史を徹底分析
-
NVIDIA などが Proteina をリリース、モデルパラメータが RFdiffusion の 5 倍を超え、de novo タンパク質バックボーン設計で最先端のパフォーマンスを実現!
-
OpenAIのアカウントが暗号通貨ハッカーにハッキングされ、15ヶ月間で4件目のハッキング事件となった。ネットユーザーからは「彼らのAIのセキュリティは依然として信頼できるのか?」という疑問の声が上がっている。