|
AlphaFold2はリリース以来、AI4S分野で大きなセンセーションを巻き起こし、今年のノーベル賞も受賞しました。そのアップグレード版であるAlphaFold3は、タンパク質の構造を予測するだけでなく、リガンド(小分子)や核酸(DNAとRNA)がどのように凝集し相互作用するかを含め、タンパク質と様々な生体分子との相互作用の構造も予測できます。 先月、Google DeepMindは学術研究向けにAlphaFold3モデルの重みと依存関係データベースをオープンソース化しました。HyperAIは現在、AlphaFold3依存関係データベースを提供しており、論文を読みながらAlphaFold3がもたらす技術的ブレークスルーを皆様に体験していただければ幸いです。 オンラインで使用: https://go.hyper.ai/wVItz 12月9日から12月13日までのhyper.ai公式サイトの更新内容の概要は次のとおりです。
公式サイトをご覧ください: hyper.ai 選択された公開データセット1. Alphafold3 はデータベースに依存します。 このデータベースには、BFD small、MGnify、PDB、PDB seqres、UniProt、UniRef90、NT、RFam、RNACentral の 9 つのデータベースを含む、AlphaFold 3 が依存する多数のタンパク質および RNA データベースが含まれています。 直接使用する: https://go.hyper.ai/wVItz 2. Mol-Instructions: 生体分子の指示に関する大規模データセット このデータセットには、分子誘導指示、タンパク質誘導指示、そして生体分子テキスト指示の3種類の指示が含まれています。生体分子領域における大規模言語モデルの理解と予測能力を向上させるための豊富な指示データを提供することを目的としています。 直接使用する: https://go.hyper.ai/Gut1y データセットの例 3. CoSQL 会話型テキスト-SQL データセット CoSQL には、モデルの堅牢性を検証するために、異なるグループが使用するデータベース間で重複のない 200 のデータベースにまたがる 3,000 以上のダイアログと 10,000 以上のラベル付き SQL クエリが含まれています。 直接使用する: https://go.hyper.ai/9Blzy データセットの例 4. QAngaroo マルチステップ推論読解データセット このデータセットは、WikiHop と MedHop の 2 つの部分で構成されており、マルチホップ推論を実行できる読解方法を構築することを目的としています。つまり、異なるドキュメントに散在する事実を複数のステップで推論して、新しい事実に到達する必要があるということです。 直接使用する: https://go.hyper.ai/u1qRw MedHopデータセットの例 5. 古代中国医学文献データセット このデータセットには、秦以前の時代から清朝後期、そして中華民国に至るまでの医学古典を網羅した約700点の古代中国医学文献が含まれています。これらの文献には、医学理論、処方、薬理学だけでなく、豊富な臨床症例と医学百科事典的な知識も含まれています。 直接使用する: https://go.hyper.ai/8Vh6A 6. IndustryCorpus2 ヘルスケア データセット サブセット このデータセットは、ヘルスケア分野の研究と応用のために特別に設計された高品質なデータリソースです。データの正確性と信頼性を確保するために、厳格なスクリーニングとクリーニングプロセスを経ています。医療記録、医学文献、患者のフィードバックなど、ヘルスケア分野の様々なデータタイプを幅広くカバーしており、研究者や開発者に探索とイノベーションのための包括的な視点を提供します。 直接使用する: https://go.hyper.ai/G9qn2 7. P-MMEval多言語マルチタスクベンチマークデータセット このデータセットには、コード生成、知識理解、数学的推論、論理的推論、指示の追跡などのタスクをカバーする 3 つの基本的な自然言語処理 (NLP) データセットと 5 つの高度な機能固有のデータセットが含まれています。 直接使用する: https://go.hyper.ai/qbzhv 8. 神農TCMデータセット このデータセットには、エンティティ中心の自己学習法を用いて生成された11万以上の学習データポイントが含まれています。これらのデータポイントは、伝統中国医学分野におけるコアエンティティと様々なインテントシナリオを中心に展開されています。これにより、伝統中国医学に関する質問への回答能力が向上するだけでなく、伝統中国医学の診断を支援し、個人に合わせた医療アドバイスを提供することも可能です。 直接使用する: https://go.hyper.ai/Okruv 9. DS-1000 コード生成ベンチマークデータセット このデータセットには、StackOverflow からの実際のデータ サイエンスの問題 1,000 件が含まれており、NumPy、Pandas、TensorFlow など、Python で広く使用されている 7 つのデータ サイエンス ライブラリをカバーしています。 直接使用する: https://go.hyper.ai/AL4h0 10. IndustryCorpus2-観光-地理データセット このデータセットは、Zhiyuan Industry Dataset IndustryCorpus2の観光地理データセットのサブセットです。観光地理学分野における様々なデータタイプ(観光名所の説明、旅行ガイド、観光客のレビュー、地理情報など)を幅広くカバーしており、自然言語処理、機械学習、データマイニング、観光レコメンデーションシステムなど、様々な研究・応用分野に豊富な応用シナリオを提供します。 直接使用する: https://go.hyper.ai/FIAM9 厳選された公開チュートリアル1. Allegroビデオ生成デモ Allegroは、基本的なテキスト入力を高解像度の動画コンテンツに変換できます。具体的には、720pの解像度、15フレーム/秒の滑らかなフレームレート、最大6秒の動画再生が可能です。このモデルは、動画合成の分野において卓越した性能を発揮し、品質と時間的一貫性の両方において優れています。 このチュートリアルはモデル推論に関するものです。モデルから動画を生成するには長い時間がかかるため、このチュートリアルでは5秒間の動画効果しか生成できません。 オンラインで実行: https://go.hyper.ai/MgUVZ 効果の例 2. IC-Light v2: AI照明制御アップグレードデモ IC-Light(Imposing Consistent Lightの略)は、機械学習モデルを用いて画像にリライティングを施すプロジェクトです。このチュートリアルは、IC-Light v2のアップグレード版です。オリジナルのIC-Lightと比較して、このバージョンはFluxモデルに基づいて学習されているため、画像の照明と色調の特性をより正確に識別し、より詳細でリアルなブレンディング効果を実現できます。 画像の照明効果を制御するには、以下のリンクのチュートリアルに従ってください。 オンラインで実行: https://go.hyper.ai/hg0cM 効果の例 3. Hunyuan3D: わずか 10 秒で 3D アセットを生成します。 Hunyuan3Dは3D生成拡散モデルであり、軽量版と標準版の両方が用意されており、テキストと画像の入力から高品質の3Dアセットを生成できます。定性的および定量的な多次元評価の結果、Hunyuan3D-1.0は、幾何学的詳細度、テクスチャ詳細度、テクスチャと幾何学的形状の整合性、3Dの妥当性、および命令の適合性において優れた性能を示しました。 このチュートリアルはHunyuan3Dの軽量版です。以下のリンクをクリックしてチュートリアルの指示に従い、3Dモデルの生成を体験してください。 オンラインで実行: https://go.hyper.ai/Rsrno 効果の例 厳選されたコミュニティ記事1. AIの第一人者ヒントン氏が指揮を執る素材スタートアップ企業CuspAIは、最も注目される英国のスタートアップ企業の一つとなった。 スタートアップ企業であるCuspAIの強みは、決して軽視すべきではありません。シードラウンドでは3,000万ドルという巨額の資金を調達し、その年のヨーロッパ最大級のシードラウンドの一つとなりました。さらに、機械学習の専門家であるマックス・ウェリング氏が共同創業者の一人であり、ノーベル賞受賞者でチューリング賞受賞者のジェフリー・ヒントン氏が取締役顧問を務めています。この記事では、CuspAIについて詳しくご紹介します。 レポート全文はこちら:https://go.hyper.ai/3fQFG 2. 時系列予測の「ブラックボックス」問題に挑む!華中科技大学がCGSマスクを提案し、患者の生存率の主要指標を解明 AI技術が日常生活に広く応用されるにつれ、モデルの「解釈可能性」は徐々に喫緊の課題となっています。特に時系列予測タスクにおいて、この問題は顕著です。時系列予測を「可視化」するために、華中科技大学の陸鋒氏率いるチームは、シドニー大学および同済病院のゾマヤ院長チームと共同で、新しい手法であるCGS-Maskを提案しました。時系列予測と解釈可能性を組み合わせることで、この手法はモデルの予測精度を向上させると同時に、予測結果をより直感的で解釈しやすいものにすることができます。本稿では、この論文の詳細な解説と共有を行います。 レポート全文はこちら:https://go.hyper.ai/TFEsd 3. デモを一足先にチェック!分子レベルからゲノムレベルまでの予測と生成を可能にする基礎ゲノムモデル「Evo」がScience誌の表紙を飾りました。 米国スタンフォード大学とアーク研究所の研究チームが、画期的なゲノムモデル「Evo」をScience誌のカバー記事として発表しました。Evoは、DNA、RNA、タンパク質を含むマルチモーダルタスクにおいて、ゼロショット予測と高精度な生成を実現します。HyperAIチュートリアルセクションに「Evo:分子スケールからゲノムスケールまでの予測と生成」が掲載されており、ワンクリックですぐに体験できます。 レポート全文はこちら:https://go.hyper.ai/5WPGm 4. AIのゴッドファーザー、ジョン・ヒントンは天才一家に生まれましたが、度重なる犯罪を繰り返し、学校を中退しました。70代でチューリング賞とノーベル賞の両方を受賞しました。 AIのゴッドファーザー、ヒントンは天才一家に生まれましたが、大学を中退し、犯罪を繰り返していました。彼が立ち上げたスタートアップはわずか3人でしたが、Googleに4400万ドルで買収されました。彼は半世紀近くニューラルネットワークの開発に取り組みましたが、そのことを後悔していると率直に認めています。どのような人生経験が、今の彼を形作ったのでしょうか?この記事は、ヒントンについて詳しく掘り下げたレポートです。 レポート全文はこちら:https://go.hyper.ai/EHWs6 5. vLLMの中国語版ドキュメントが初めて公開されました!最新バージョンでは、スループットが2.7倍向上し、レイテンシが5分の1に削減され、大規模言語モデルの推論速度が向上しました! vLLMは、大規模言語モデルの推論を高速化するために設計されたフレームワークであり、キーバリューキャッシュにおけるメモリの無駄をほぼゼロに抑えています。最新バージョンのv0.6.4では、マルチステップスケジューリングと非同期出力処理が導入され、GPU利用率のさらなる最適化と処理効率の向上が実現されています。国内の開発者がvLLMのバージョンアップデートや最先端の開発情報に容易にアクセスできるよう、HyperAIコミュニティはvLLMのドキュメントを中国語にローカライズしました。 vLLM の中国語ドキュメントを見る: https://vllm.hyper.ai/ 人気のある百科事典の項目1. メルケプストラムMFCC 2. RRFと融合した逆ソート 3. MLMのマスク言語モデル 4. パレートフロント 5. データ拡張 この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。 https://go.hyper.ai/wiki トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event 今週のエディターズピックはこれで終了です。hyper.ai公式サイトに掲載してほしいリソースがありましたら、ぜひコメントを残していただくか、作品をご提出ください。 来週お会いしましょう! |
Alphafold3 の依存関係データベースが利用可能になりました! ICLR 満点論文 IC-Light: 照明色相特徴の正確な識別。
関連するおすすめ記事
-
Haomoの最新の全社員向けレター:インテリジェント運転コンテストは「生死を分ける」戦いであり、全員が危機を認識しなければなりません。
-
シリコンバレーのテクノロジー界の巨人たちがトランプ大統領就任式に集結!
-
Ideal Open Bookの最新ランキング:トップAIカンファレンスCVPRに選ばれた4つの論文
-
中国におけるオープンソースソフトウェアとハードウェアの開発を促進するための経験と提案
-
スタンフォードの大規模モデル数学問題が暴露されました。問題文のわずかな変更が総合的な知能の低下を引き起こし、O1 数学のスコアさえも不正確になります。
-
DeepSeekは一夜にしてBaiduを20年前の状態に戻した。ネットユーザー:これは本当か?