618ZXW

A6000 SIMカード1枚でワンクリックでAlphaFold3を起動するチュートリアルを公開しました!7万本以上の動画と50種類のエンティティを含む360度モーションキャプチャデータセットが公開されました。

先週、HyperAl は AlphaFold3 に必要なデータベースを更新しましたが、多くのユーザーからデータが大きすぎて展開が困難であるとの報告がありました。

今週、 hyper.aiは公式ウェブサイトで「AlphaFold3 タンパク質予測デモ」を公開しました。関連データとモデルはインストール・設定済みで、個人用ストレージの容量は300MB未満です。AlphaFold3は、A6000カード1枚だけですぐに導入・利用でき、タンパク質予測に使用できます。

オンラインで使用: https://go.hyper.ai/KHIRR

12月16日から12月20日までのhyper.ai公式サイトの更新内容の概要は次のとおりです。

  • 高品質の公開データセット: 10
  • 厳選された高品質のチュートリアル:3
  • 選択されたコミュニティ記事: 4
  • 人気の百科事典の項目: 5
  • 1月締め切りのトップカンファレンス:9

公式サイトをご覧ください: hyper.ai

選択された公開データセット

1. ドローン検出データセット

このデータセットは10,000枚以上のドローン画像で構成されており、それぞれが注釈付きのバウンディングボックスで囲まれています。バウンディングボックスは正確な位置特定情報を提供し、様々な背景や環境におけるドローンの検知と追跡を可能にします。このデータセットは、特に監視、ドローン検知、自律追跡などの用途において、物体検知タスクのためのコンピュータービジョンモデルの学習と評価に適しています。

直接使用する: https://go.hyper.ai/686JV

データセットの例

2. 360Motion-Dataset モーションキャプチャデータセット

このデータセットのバージョンV1には、様々な動物など50種類のエンティティを網羅した7万2千本の動画と、砂漠シーン1つとHDRIシーン2つを含む6つのUnreal Engine (UE) シーンが含まれています。さらに、データセットには121種類の軌跡テンプレートが含まれており、研究者は豊富な動作パターンと行動のバリエーションを分析できます。

直接使用する: https://go.hyper.ai/rsmeQ

データセットの例

3. 脳腫瘍データセット(脳腫瘍の医療データセット)

このデータセットは、様々なモデルを用いて脳腫瘍を分類・セグメンテーションするために使用された画像のコレクションです。神経膠腫の画像1,621枚、髄膜腫の画像1,775枚、下垂体の画像1,757枚、そして腫瘍のない(健康な)脳の画像2,000枚を含む、計7,153枚の画像が含まれています。

直接使用する: https://go.hyper.ai/zgX7A

データセットの例

4. LAION-SG大規模高品質画像理解データセット

LAION-SGには、オブジェクト、属性、関係性に関するアノテーションが付与された540,005個のシーングラフと画像のペアが含まれています。このデータは、トレーニングセット、検証セット、テストセットに分かれています。データセット内の画像はLAION-Aesthetics V2(6.5+)データセットから取得されており、アノテーション処理ではGPT-4oを用いて自動アノテーションを行っています。

直接使用する: https://go.hyper.ai/HHT6V

データセットの例

5. 衣服属性データセット

このデータセットには、長袖、襟付き、ストライプ柄など、26種類の基本的な衣服属性を持つ1,856枚の画像が含まれています。ラベルはAmazon Mechanical Turkを使用して収集されました。

直接使用する: https://go.hyper.ai/7f3ej

データセットの例

6. AI生成顔検出データセット

このデータセットには、実物の顔とAI生成の合成顔の高品質な画像3,203枚が含まれており、そのうち2,202枚は実物画像、1,001枚はAI生成画像です。機械学習およびディープラーニングアプリケーション向けに特別に設計されており、実物の顔とAI生成の顔を区別できる顔画像リソースを提供することを目指しています。ディープフェイク検出、画像の真正性検証、顔画像分析などのタスクに適しており、最先端の研究とアプリケーションをサポートできます。

直接使用する: https://go.hyper.ai/SwMXL

データセットの例

7. U-MATH 数学的推論データセット

このデータセットには、実際の教材から抽出され、初等数学、代数、微分積分、積分、多変数微分積分、数列と級数の 6 つの主要な数学トピックを網羅した、未発表の大学レベルの数学問題 1.1k 点が含まれています。

直接使用する: https://go.hyper.ai/FcNc2

8. Open01-SFT 教師ありファインチューニングデータセット

OpenO1-SFTデータセットは、教師ありファインチューニング(SFT)手法を用いて言語モデルの思考連鎖能力を活性化することに重点を置いたデータセットであり、一貫性のある論理的推論シーケンスを生成するモデルの能力を向上させることを目的としています。77,685件のレコードが含まれており、中国語と英語の両方をカバーしているため、多言語環境で効果的に活用できます。

直接使用する: https://go.hyper.ai/KlyzY

9. QwQ-LongCoT-130K 微調整データセット

QwQ-LongCoT-130Kデータセットは、O1のような大規模言語モデル(LLM)の学習用に特別に設計されたSFT(教師ありファインチューニング)データセットです。このデータセットには約13万個のインスタンスが含まれており、各インスタンスはQwQ-32B-Previewモデルを使用して生成されたレスポンスです。

直接使用する: https://go.hyper.ai/kE9aG

10. ヘルスケア特許における機械学習:ヘルスケア特許データセット

このデータセットは、検索クエリ「機械学習とヘルスケア」を使用して Google Patents からまとめられたもので、医用画像、診断ツール、AI による治療推奨など、さまざまな分野で付与された特許が含まれています。

直接使用する: https://go.hyper.ai/8p1M5

厳選された公開チュートリアル

1. AlphaFold3 タンパク質予測デモ

AlphaFold3 は、Google の DeepMind が 2024 年に開発した人工知能 (AI) ツールです。AlphaFold3 モデルは、拡散ベースのアーキテクチャを使用して、タンパク質構造だけでなく、核酸、小分子、イオン、修飾残基などの複合体の構造も予測できます。

このチュートリアルでは、1 枚の A6000 カードだけで実行できる AlphaFold3 を迅速に展開して使用し、タンパク質を予測する方法を説明します。

オンラインで実行: https://go.hyper.ai/KHIRR

視覚化

2. RMBG-2.0: オープンソースの背景除去モデル

RMBG-2.0 は、さまざまなカテゴリや画像タイプにわたって前景と背景を効果的に分離するように設計されたオープンソースの背景除去モデルです。

モデルは環境設定と依存関係が完了しており、APIアドレスにアクセスすることでワンクリックで画像切り抜きを体験できます。

オンラインで実行: https://go.hyper.ai/FF10L

モデル例

3. DePLM: ノイズ除去言語モデルを用いたタンパク質の最適化(小サンプルサイズ)

タンパク質言語モデルのノイズ除去(DePLM)は、タンパク質言語モデルによって捕捉された進化情報を、最適化対象となる特徴に関連する情報と関連しない情報の混合物として扱うことができます。関連しない情報は「ノイズ」として扱われ、除去されます。これにより、タンパク質の適応ランドスケープを予測する際のモデルの精度が向上し、最適化のための機能的に最適な配列を特定するのに役立ちます。

このチュートリアルでは、浙江大学がリリースしたノイズ除去タンパク質言語モデル (DePLM) のトレーニングと推論を、NeurIPS 24 に選択された関連結果とともに紹介します。プラットフォームでは必要な環境とデータセットがすでに構成されているため、ユーザーはチュートリアルで提供されているコマンドを直接実行してトレーニングと推論を行うことができます。

オンラインで実行: https://go.hyper.ai/ktd87

厳選されたコミュニティ記事

1. Tu Youyou 氏の支援を受けて、米国の AI 主導型製薬会社が開発した初の医薬品候補が、5 年間で 8 回の資金調達を獲得し、臨床試験に入りました。

米国を拠点とするAI駆動型医薬品開発スタートアップ企業Envedaは先日、シリーズCラウンドで1億3,000万ドルの資金調達を完了したことを発表しました。これにより、同社の累計資金調達額は3億6,000万ドルに達しました。さらに、今年10月末には、Envedaプラットフォームを用いて発見された最初の医薬品候補物質であるENV-294がFDAのIND承認を取得し、第I相臨床試験に入りました。本記事では、Envedaの詳細な情報をご紹介します。

完全なレポートを見る: https://go.hyper.ai/rMk2U

2. チベット高原のデータ不足問題に対処!浙江大学のチームが、チベット高原の地表熱流分布を説明する新しいGeoAIモデルを提案。

チベット高原は、その特殊な地理的条件により、起伏の多い地域の一部において地表熱流量データが著しく不足しています。この問題に対処するため、浙江大学地球科学学院は、解釈可能性を高めた地理ニューラルネットワークに基づく加重回帰モデルを提案しました。このモデルは、チベット高原における熱流量分布と地質力学的メカニズムの包括的な理解に向けた、新たな研究枠組みと技術的支援を提供します。本稿では、この研究論文の詳細な解釈と共有を行います。

レポート全文はこちら:https://go.hyper.ai/vqQDi

3. NeurIPS 2024への論文投稿体験談を共有!浙江大学のチームがDePLMモデルを用いてタンパク質最適化を支援し、論文の筆頭著者がオンラインでデモを発表しました。

Meet AI4S第5回ライブストリームでは、浙江大学ナレッジエンジンラボの博士課程学生である王澤元氏が、NeurlPS 2024に選出された成果とデモを披露しました。また、論文投稿の経験についても共有し、貴重な情報を提供しました。今すぐクリックしてご覧ください!

完全なレポートを見る: https://go.hyper.ai/PLyBo

4. DeepMind と Google Research は、複数の技術的アプローチを通じて AI 天気予報の「六角形の戦士」を作り出すために協力しています。

GoogleのDeepMindとGoogle Researchは、短期、中期、長期の予測を考慮し、従来の方法とAIを統合し、天気予報の「六角形の戦士」を徐々に構築し、天気予報の分野で多くの成果を発表しています。

レポート全文はこちら:https://go.hyper.ai/Cvzkc

人気のある百科事典の項目

1. RRFと組み合わせた逆ソート

2. マスク言語モデル(MLM)

3. 核の規範

4. コルモゴロフ・アーノルド表現定理

5. データ拡張

この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。

https://go.hyper.ai/wiki

トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event


今週のエディターズピックはこれで終了です。hyper.ai公式サイトに掲載してほしいリソースがありましたら、ぜひコメントを残していただくか、作品をご提出ください。