|
先月、大規模モデル推論の需要が急増する中、AI大規模モデル推論フレームワークvLLMがバージョン1.0を正式にリリースしました。以前のバージョンと比較して、計算効率が大幅に向上し、API設計がより安定し、ハードウェアの潜在能力が最大限に発揮され、推論速度が1.7倍に向上しました。数十億のパラメータを持つモデルの効率的な展開をより強力にサポートします。 現在、 hyper.aiのウェブサイトではvLLM入門チュートリアルを公開しており、インストールから操作方法までをガイドし、vLLMを素早くマスターするのに役立ちます。 vLLM入門チュートリアル: https://go.hyper.ai/qHl62 vLLM の中国語ドキュメントとチュートリアルについては、こちらを参照してください → https://vllm.hyper.ai 2月5日から2月14日までのhyper.ai公式ウェブサイトの更新の概要は次のとおりです。 * 高品質の公開データセット: 10 * 厳選された高品質のチュートリアル:6 * 注目のコミュニティ記事: 5 * 人気の百科事典の項目: 5 2月締め切りのトップカンファレンス:3 公式サイトをご覧ください: hyper.ai 選択された公開データセット1. VRC-Bench 視覚推論ベンチマークデータセット このデータセットは、視覚的推論、数学的・論理的推論、科学的推論、文化的・社会的理解など、8つの異なる領域の課題を網羅しています。4,000以上の手動検証済み推論ステップが含まれており、多段階推論におけるモデルの精度と論理的一貫性を包括的に評価できます。 直接使用する: https://go.hyper.ai/AV43N データ例 2. Terraマルチモーダル時空間データセット Terraは、全世界45年分の時空間データを提供するグローバルマルチモーダル時空間データセットであり、648万点の高解像度グリッドポイントをカバーしています。時空間データマイニングの将来的な研究を促進し、より広範な時空間インテリジェンスの実現を推進することを目的としています。 直接使用する: https://go.hyper.ai/9eev3 Terraのさまざまなモーダルコンポーネント 3. PokerBenchポーカーゲーム評価データセット このデータセットには、11,000の主要シナリオが含まれており、プリフロップシナリオ1,000とポストフロップシナリオ10,000に分かれており、幅広いゲーム状況をカバーしています。このデータセットは、複雑で戦略的なポーカーゲームにおける大規模言語モデル(LLM)の性能を評価するために設計されています。 直接使用する: https://go.hyper.ai/HK73H データの概要 4. 中国都市観光詳細データセット このデータセットには、中国の352都市の観光名所データが含まれています。各都市のCSVファイルには100か所の観光スポット情報が含まれており、データには場所名、ウェブサイト、住所、観光スポットの説明、営業時間、画像URL、評価、推奨滞在期間、推奨シーズン、チケット情報、ヒントなどが含まれています。 直接使用する: https://go.hyper.ai/uZ5Wh 5. GF-Minecraft ゲームビデオデータセット このデータセットは、事前に定義されたランダムなアクションシーケンスを実行することで70時間分のゲームビデオを収集し、アクションに注釈を付けました。データセットは、3つのバイオーム(森林、平原、砂漠)、3つの気象条件(晴れ、雨、雷雨)、6つの時間帯(例:日の出、正午、真夜中)で事前に設定されており、2,000本以上のビデオクリップが生成されました。 直接使用する: https://go.hyper.ai/25DAe 6. NCIFD民族文化微調整データセット このデータセットは、大規模モデル用の民族文化の微調整データセットであり、建築、衣服、工芸、食品、エチケット、言語、習慣の 7 つの主要分野をカバーする 151,159 個のデータ ポイントが含まれています。 直接使用する: https://go.hyper.ai/Vd6ZP 7. AceMath Instructトレーニングデータ(数学的推論データセット) このデータセットは、数学的推論タスクにおけるモデルのパフォーマンスを向上させることを目的として、AceMath モデルのトレーニング用に NVIDIA によって 2025 年にリリースされました。 直接使用する: https://go.hyper.ai/pT5Tr 8. ComplexFuncBench: 複雑な関数呼び出しを評価するためのデータセット。 このデータセットには、5つの実世界のシナリオから抽出された1,000件の複雑な関数呼び出しサンプルが含まれています。これには、ホテル、航空券、レンタカー、観光地からそれぞれ150件ずつ、合計600件の単一ドメインサンプルと400件のクロスドメインサンプルが含まれます。タクシードメインには関数が2つしかないため、クロスドメイン処理にのみ使用されます。 直接使用する: https://go.hyper.ai/v0p4c 9. TravelPlanner 旅行計画データセット このデータセットには、綿密に作成された1,225件の計画意図と参考プランが含まれています。旅行計画という背景を踏まえ、このデータセットでは、言語エージェントが与えられたクエリに基づいて、交通手段、毎日の食事、観光スポット、宿泊施設などの詳細を含む包括的な旅行プランを生成することが求められます。 直接使用する: https://go.hyper.ai/22AhZ 10. 水溶解度データ:無機化合物データセット このデータセットには、複数の文献から得られた数百種類の無機化合物の実験的な水溶解度データが含まれており、マテリアルズ・インフォマティクスに適しています。すべての溶解度データは、水100グラムあたりの溶質のグラム数で表されます。 直接使用する: https://go.hyper.ai/dqL1y 厳選された公開チュートリアル1. vLLM入門チュートリアル:初心者向けステップバイステップガイド vLLMは大規模言語モデルの推論を高速化するために設計されたフレームワークであり、その優れた推論効率とリソース最適化機能により、世界中で大きな注目を集めています。研究者らは、高スループットの分散LLMサービスエンジンvLLMを構築し、キーバリューキャッシュにおけるメモリの無駄をほぼゼロに抑え、大規模言語モデルの推論におけるメモリ管理のボトルネック問題を解決しました。 このチュートリアルでは、vLLMの設定と実行方法をステップバイステップで解説し、インストールから起動まで包括的な入門ガイドを提供します。以下のリンクをクリックして、チュートリアルの手順に従ってvLLMを展開してください。 オンラインで実行: https://go.hyper.ai/qHl62 vLLMの導入 2. Qwen2.5-Coderのワンクリック展開 Qwen2.5-Coderは、強力なコード生成機能を備えたAIアシスタントです。論理的に明確で構文的に正しいコード出力をサポートし、アーティファクト機能により、様々なビジュアルプロジェクトの迅速な構築と実装を支援します。ミニゲーム開発において、Qwen2.5-Coderはゲームのルール、ビジュアルスタイル、ユーザーエクスペリエンスの要件に基づいてゲームコードを生成できます。開発者は、このコードをカスタマイズおよび最適化することで、独自のゲームを迅速にリリースできます。 このプロジェクトは、Gradoインターフェースを介してフロントエンドのインタラクティブインターフェースを生成できます。関連するモデルと依存関係はデプロイ済みです。ワンクリックで起動し、モデルにコマンドを入力するだけで必要なコードが生成されます。 オンラインで実行: https://go.hyper.ai/JVOTN モデル対話例 3. GLM-4-Voice エンドツーエンド英語-中国語音声対話モデル GLM-4-Voice は、中国語と英語の音声を直接理解・生成し、リアルタイムの音声会話を実施し、ユーザーの指示に従って感情、トーン、速度、方言などの音声の属性を変更できるエンドツーエンドの音声モデルです。 公式 Web サイトにアクセスし、コンテナのクローンを作成して起動し、API アドレスをコピーするだけでモデルを操作できます。 オンラインで実行: https://go.hyper.ai/s4MId デモ例 4. Linly-Dubbing: ワンクリックでビデオをダウンロード + 翻訳 + 吹き替え + 字幕 Linly-Dubbing は、ビデオコンテンツを複数の言語に自動翻訳し、字幕を生成できるインテリジェントなビデオ多言語 AI 吹き替えおよび翻訳ツールです。 今すぐ以下のリンクをクリックしてクリエイティブな旅を始めて、ビデオの多言語 AI 吹き替えと翻訳を実現しましょう。 オンラインで実行: https://go.hyper.ai/xEAzn 機能プレビュー 5. DrawingSpinUp: 2Dキャラクター描画 → 3Dアニメーション DrawingSpinUp は、オリジナルのアートワークのスタイルと特徴を慎重に保持しながら、平面的なキャラクターの描画をダイナミックな 3D アニメーションに変換する革新的な 3D アニメーション生成テクノロジーです。 チュートリアルの手順に従って、リアルで詳細な 3D アニメーションを生成します。 オンラインで実行: https://go.hyper.ai/H9fV1 デモ例 6. Whisper-large-v3-turbo 音声認識・翻訳デモ Whisperは汎用的な音声認識モデルです。多様な音声データセットを用いて学習されており、多言語音声認識や音声翻訳といった複数のタスクを実行できます。 このチュートリアルでは、whisper-large-v3-turbo のワンクリックデプロイガイドをご紹介します。whisper-large-v3 と比べて 8 倍高速でありながら、品質の低下はほとんどありません。必要な環境と依存関係は既にインストール済みなので、クローンを作成してすぐにお使いいただけます。 オンラインで実行: https://go.hyper.ai/3P9nk デモ例 厳選されたコミュニティ記事1. Nvidia と Samsung から投資を受けた Generate は、100 万を超えるタンパク質を作成し、ゼロから設計された生成モデルを開発しました。 AIを活用したバイオメディシン企業Generate:独自のプログラマブル生物学プラットフォームを備えたBiomedicinesは、タンパク質工学に人工知能を深く統合するだけでなく、従来は創薬が困難だった標的に対するより効率的なソリューションの設計を科学者に支援しています。Generateは最近、サムスン科学生命基金からの戦略的投資を発表しましたが、その意義は明白です。この記事ではGenerateの詳細なレポートを掲載しています。続きを読むにはクリックしてください。 イベントの要約を見る: https://go.hyper.ai/fVtKK 2. 甲骨文物の高精度データが中国に返還され、AIが古代テキストの解読を支援し、甲骨文の新しい画像の発見につながった。 近年、古代中国の文献研究分野におけるAIの応用がますます進んでいます。2024年6月、安陽師範大学は華中科技大学および華南理工大学と共同で、甲骨文字の解読に最適化された条件拡散モデルを提案しました。この研究はACL 2024に選出されただけでなく、最優秀論文賞を受賞しました。これは、AIが研究者の作業効率を加速させていることを示しています。AIによる甲骨文字の解読方法については、以下で詳しく説明します。 レポート全文はこちら:https://go.hyper.ai/xzw4c 3. 神農伝統中国医学、古代中国医学テキスト、医学推論、医療Q&Aなどを網羅した、10の主要な中国医学データセットの集大成。 医療用人工知能の急速な発展は、高品質なデータセットに大きく依存しています。疾患診断から医薬品開発、個別化医療に至るまで、データセットはマシンビジョン、大規模モデル、その他の医療技術の応用を推進する上で不可欠な役割を果たしています。この記事では、神農中医学、古代中国医学文献、医療推論、医療質問応答など、医療分野における10のデータセットをまとめています。これらのデータセットは直接ダウンロードできます。 レポート全文はこちら:https://go.hyper.ai/NHlJ0 4. 医薬品開発会社 Cellaire は、NVIDIA と連携して、強化学習に基づいて標的分子を最適化し、最大 100% の成功率を実現しています。 人工知能(AI)の急速な発展は、創薬に新たな可能性をもたらしました。最近、ライフサイエンス企業CellaireとNVIDIAの研究者は、潜在強化学習に基づく新たな標的分子最適化手法MOLRLを共同で提案しました。この手法は、創薬タスク、特に標的分子生成とマルチパラメータ最適化において優れた性能を発揮することが実証されています。本稿では、この論文の詳細な解釈と共有を行います。 完全なレポートを見る: https://go.hyper.ai/YBhnM 5. 南開大学の鄭偉教授:AlphaFold は完璧ではなく、学術界にはまだ「カーブで追い抜く」チャンスがあります。 「Meet AI4S」ライブストリームシリーズの第6回では、南開大学統計・データサイエンス学院の鄭偉教授が、AlphaFoldの限界と将来の最適化の方向性、そして学術界でさらに議論する価値のあるその他のアルゴリズムや研究トピックについて洞察を共有しました。詳細は以下をご覧ください。 レポート全文はこちら:https://go.hyper.ai/YgCip 人気のある百科事典の項目1. RRFと組み合わせた逆ソート 2. モデルパラメータ 3. コルモゴロフ・アーノルド表現定理 4. 大規模マルチタスク言語理解MMLU 5. 対照学習 この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。 https://go.hyper.ai/wiki トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event 今週のエディターズピックはこれで終了です。hyper.ai公式サイトに掲載してほしいリソースがありましたら、ぜひコメントを残していただくか、作品をご提出ください。 来週お会いしましょう! |