618ZXW

マイクロソフトとテンセントが技術衝突、TRELLISが3D生成におけるマルチフォーマットサポートの新たな方向性をリード、5,000問以上が正答!VIS-BenchがAIによる「空間記憶」学習を可能に。

テンセントは昨年11月、テキストと画像から同時に3Dモデルを生成する業界初のオープンソース大規模モデル「Hunyuan3D」をリリースしました。それから1ヶ月も経たないうちに、マイクロソフトは新たなフレームワーク「TRELLIS」をリリースし、3Dアセット生成分野への参入を果たしました。TRELLISは、放射場、3Dガウス分布、メッシュなど、複数の出力形式をサポートし、様々なニーズに最大限の柔軟性を提供します。

どちらのモデルもhyper.aiのウェブサイトでご覧いただけます。ぜひ、どちらが優れているかお試しください!

オンラインで Hunyuan3D を使用する: https://go.hyper.ai/Rsrno

TRELLIS をオンラインで使用: https://go.hyper.ai/JE5s5

1 月 6 日から 1 月 11 日までの hyper.ai ウェブサイトの更新の概要は次のとおりです。

  • 高品質の公開データセット: 10
  • 高品質なチュートリアルのセレクション:6
  • 選択されたコミュニティ記事: 8
  • 人気の百科事典の項目: 5
  • 1月締め切りのトップカンファレンス:7

公式サイトをご覧ください:hyper.ai

選択された公開データセット

1. VSI-Bench 視覚空間知能ベンチマークセット

このデータセットには、住宅、オフィス、工場などのさまざまな環境を含む約 290 の実際の屋内シーン ビデオを網羅した 5,000 を超える質問と回答のペアが含まれており、物体認識、位置関係、行動予測などの問題の複数の側面を網羅しています。

直接使用する: https://go.hyper.ai/q0DYA

VSI-Benchタスクのデモンストレーション

2. 顔特徴抽出データセット

このデータセットは、眉毛、目、鼻、唇、ひげなどの顔の特徴を検出するために使用された750枚の画像を含むラベル付きデータセットです。データのラベル付け処理はRoboflowで実行され、YOLOv8形式でエクスポートされました。

直接使用する: https://go.hyper.ai/O3kER

データセットの例

3. 感情分析データセット

このデータセットには422,000件の感情分析文が含まれており、さらに3,309件の感情分析文が追加されています。感情分析は、喜び、悲しみ、怒り、恐怖、愛情、驚きの6つの異なる感情でタグ付けされています。

直接使用する: https://go.hyper.ai/wFNO6

4. Eurus-2-RL-Data 数理計画問題トレーニングデータセット

このデータセットは、強化学習のトレーニング用に特別に設計された高品質のデータセットで、主に数学とプログラミングの問題を解くために使用され、約 455,000 個の数学の問題と 27,000 個のプログラミングの問題が含まれています。

直接使用する: https://go.hyper.ai/Wdo1k

5. 医療推論SFTデータセット

このデータセットは、HuatuoGPT-o1医療大規模言語モデルの微調整を目的として特別に設計され、複雑な医療推論タスクにおけるパフォーマンスの向上を目指しています。データセットはGPT-4oを用いて構築され、検証可能な医療関連の質問を検索し、医療検証ツールを用いて回答を検証することで、その精度と信頼性が確保されています。

直接使用する: https://go.hyper.ai/XMtXp

6. MCTS中国語簡体字テキストデータセット

このデータセットには、Penn Chinese Treebank (CTB) 標準に基づいてニュースコーパスから選択された 723 の複雑な文が含まれており、各文には複数の手動で簡略化されたバージョンが付属しているため、中国語テキスト簡略化タスクの評価データセットとしては最大かつ最も参照されています。

直接使用する: https://go.hyper.ai/UR3CN

7. educhat-sft-002-data-osm: 教育分野の対話データセット。

このデータセットには、自由形式の質問、エッセイの添削、ヒューリスティックな指導、感情的なサポート、個別指導など、さまざまな教育分野を網羅した 400 万のデータ ポイントが含まれています。

直接使用する: https://go.hyper.ai/nQw0K

8. GOAT算術タスクデータセットの微調整

このデータセットは、dataset.json と dataset.ipynb の 2 つのファイルで構成されています。dataset.json ファイルには、算術タスク用に dataset.ipynb から生成された約 170 万点の合成データポイントが含まれています。

直接使用する: https://go.hyper.ai/8ZAvG

9. NaturalProofs 数学推論データセット

このデータセットは、自然言語による数学的推論を研究するための多分野コーパスです。約3万件の定理の宣言と証明、1万5千件の定義、そして2千件の追加ページ(公理や系など)が含まれており、すべて自然数学言語で記述されています。

直接使用する: https://go.hyper.ai/Bk4WE

10. TransGPT-pt & sft 交通対話事前学習データセット

このデータセットは、中国初の包括的な交通モデルであるTransGPTの一部です。このデータセットには、分野固有の事前学習に使用される交通分野のテキストデータ約346,000件と、微調整に使用される交通分野の対話データ約58,000件が含まれています。

直接使用する: https://go.hyper.ai/vuDHa

厳選された公開チュートリアル

1. Hunyuan3D: わずか 10 秒で 3D アセットを生成します。

Hunyuan3Dは3D生成拡散モデルであり、軽量版と標準版の両方が用意されており、テキストと画像の入力から高品質の3Dアセットを生成できます。定性的および定量的な多次元評価の結果、Hunyuan3D-1.0は、幾何学的詳細度、テクスチャ詳細度、テクスチャと幾何学的形状の整合性、3Dの妥当性、および命令の適合性において優れた性能を示しました。

このチュートリアルはHunyuan3Dの軽量版です。以下のリンクをクリックしてチュートリアルの指示に従い、3Dモデルの生成を体験してください。

オンラインで実行: https://go.hyper.ai/Rsrno

効果の例

2. TRELLIS: Microsoftのオープンソース3Dアセット生成モデルデモ

TRELLIS は、2024 年に Microsoft チームによって開発されたグラフ ニューラル ネットワークに基づく解釈可能性フレームワークです。グラフ構造化データの特性を学習することで、効率的なモデルの解釈可能性を提供することを目的としています。

モデルと環境がデプロイされました。チュートリアルの指示に従って、大きなモデルを使用して画像を3D画像に変換できます。

オンラインで実行: https://go.hyper.ai/JE5s5

効果の例

3. ChatGLM2-6b-32kを素早く展開する

ChatGLM-6Bは、一般言語モデル(GLM)アーキテクチャに基づくオープンソースのバイリンガル(英語と中国語)会話型言語モデルであり、62億個のパラメータを誇ります。モデル量子化技術と組み合わせることで、ユーザーは、わずか6GBのビデオメモリを搭載したコンシューマーグレードのグラフィックカードで、ローカル(INT4量子化)パフォーマンスを実現できます。

チュートリアルの手順に従って、生成された API アドレスをコピーするだけで ChatGLM-6B を使用できます。

オンラインで実行: https://go.hyper.ai/B0b7V

モデルWebインターフェース

4. 自然言語処理におけるNLTKの使用

NLTKは、自然言語データを用いたPythonプログラムを作成するための最も人気のあるプラットフォームの一つです。分類、トークン化、ステミング、タグ付け、構文解析、意味推論のためのテキスト処理ライブラリに加え、50を超える大規模な構造化テキストデータセット(コーパス)と語彙リソースへの使いやすいインターフェースを提供します。

このチュートリアルでは、テキスト処理段階で NLTK を使用してさまざまな NLP 操作を実行する方法と、感情分析とテキスト分類用の NLTK ツールを使用して Keras モデルを作成する方法について説明します。

オンラインで実行: https://go.hyper.ai/BFZ10

単語の頻度分布の例

5. オーディオLDMオーディオ編集チュートリアル

AudioLDMは、任意のテキスト入力からリアルな音声サンプルを生成できる、テキストから音声への拡散モデルです。AudioLDMはテキストキューを入力として受け取り、対応する音声を予測します。テキストベースの条件付き効果音、人間の発声、音楽などを生成できます。

このプロジェクトでは、Grado APIを使用してフロントエンドのインタラクティブインターフェースを生成します。関連するモデルと依存関係はデプロイ済みです。オーディオを編集するには、以下のリンクをクリックしてください。

オンラインで実行: https://go.hyper.ai/BCOWL

6. ShowUI: GUI 自動化のための視覚言語アクション モデルに重点を置いています。

ShowUIモデルは、画面インターフェースの内容を理解し、クリック、入力、スクロールなどのインタラクティブなアクションを実行します。Webアプリケーションとモバイルアプリケーションの両方のシナリオをサポートし、複雑なユーザーインターフェースタスクを自動的に完了できます。ShowUIはスクリーンショットとユーザーコマンドを解析し、インターフェース上のインタラクティブなアクションを予測します。

このチュートリアルでは、モデルのワンクリックデプロイのデモをご紹介します。コンテナをクローンして起動し、生成されたAPIアドレスをコピーするだけで、モデルを体験できます。

オンラインで実行: https://go.hyper.ai/reHs7

モデルWebインターフェース

💡安定拡散チュートリアルのディスカッショングループも作成しました。WeChatでHyperaiを追加(WeChat ID: Hyperai01)し、メッセージに「SD Tutorial」と記載してグループに参加して、様々な技術的な問題について議論したり、アプリケーションの結果を共有したりしてください。

厳選されたコミュニティ記事

1. 10 の主要なクリスマス データセットの編集: 過去 10 年間の人気曲、ギフトの希望リスト、レシピ、クリスマスの Twitter 投稿など...

クリスマスシーズンに合わせ、HyperAIは皆様のために、オンラインでの利用と高速ダウンロードに対応したクリスマス関連のデータセットを10種類ご用意しました。ぜひお試しください!

データセットの概要を見る: https://go.hyper.ai/if7Lc

2. コストを100分の1に削減!非営利団体E11 Bioの新たな研究結果により、数百万個の脳細胞間のつながりが明らかになりました。

バイオテクノロジー企業E11 Bioは、脳全体の数百万個の細胞間の接続を極めて低コストでマッピングできるPRISM技術を発表しました。この一連のイノベーションにより、全脳コネクトミクスのコストは少なくとも100分の1に削減されると期待されており、将来のヒト脳探査の可能性を大きく広げます。この記事では、同社に関する詳細なレポートを掲載しています。続きを読むにはクリックしてください。

レポート全文はこちら:https://go.hyper.ai/ISc4j

3. 2024 年の主要な AI 4S 業界イベントの包括的な概要。国際政策、科学的なブレークスルー、先駆的な人物、企業戦略を網羅しています。

HyperAI は、2024 年に最も影響力のある AI 科学イベントのリストをまとめました。完全なレポートを見るにはクリックしてください。

完全なレポートを見る: https://go.hyper.ai/d2Dlv

4. 地球温暖化は不可逆的です。スタンフォード大学のチームは AI を使用して最高気温の変化を予測しており、記録破りの気温になる確率は 90% です。

進行中の地球温暖化を背景に、稀な異常気象が頻発しています。スタンフォード大学、コロラド州立大学、チューリッヒ工科大学(ETH)の研究チームは、人工知能(AI)の畳み込みニューラルネットワークシステムを用いて地球温暖化を予測し、たとえ急速な排出量削減を達成できたとしても、地球の気温は依然として90%の確率で上昇し続けると結論付けました。本記事では、この研究論文の詳細な解釈と概要をご紹介します。

レポート全文はこちら:https://go.hyper.ai/vDt3e

5. 人間のような把握プロセスをシミュレートすることで、パデュー大学のチームはロボット学習のためのデータの効率的な触覚表現を実現しました。

パデュー大学博士課程3年生のZhengtong Xu氏は、「ロボット学習のための効率的な触覚表現」と題したプレゼンテーションで、2つの主要な研究成果を発表しました。それは、反応型把持コントローラLeTac-MPCと、ロボットにおける統合触覚表現のためのUniTです。この記事は彼のプレゼンテーションの要約です。クリックしてすぐにご覧ください。

レポート全文はこちら:https://go.hyper.ai/IPIjj

6. 世界知的所有権機関(WIPO)の第5回ラウンドにおけるタンパク質構造予測の主要指標であるCASPは、実用的な生物学的問題に焦点を当て、競争と課題がますます激化しています。南開大学の鄭偉氏は、この競争が激化しており、現実世界の生物学的問題に焦点を当てる必要があると指摘しています。

CASPは長らくタンパク質構造予測の先駆者として認識されてきました。こうした背景を受け、HyperAIは鄭偉教授に詳細なインタビューを行う機会を得ました。教授は、この分野における主要な国際コンペティションであるCASPを通して、タンパク質構造予測の最新動向を分析しました。貴重な洞察が満載の本書を、今すぐクリックしてお読みください!

レポート全文はこちら:https://go.hyper.ai/Y83iz

7. MIT は 30 年間の努力を経て、次世代のリチウムイオン電池の開発を目指し、生成 AI を活用した固体電解質の大きな進歩を達成しました。

MITとトヨタ・リサーチ・インスティテュートの研究チームは最近、ポリマー生成における様々な高度な生成モデルの複雑性を調査し、GPT(GPT法)と拡散モデルに基づくポリマー電解質のde novo設計手法を提案しました。これにより、実験検証のための新規候補材料の継続的な生成と評価が可能になります。本稿では、この論文の詳細な解釈と共有を提供します。

レポート全文はこちら:https://go.hyper.ai/PDc8J

8. 速報!世界最速GPU、RTX 5090が14,000元を超える価格で正式に発表されました。不具合のある5090 Dの中国版の価格は16,000元を超えています。

CES 2025において、NVIDIAはこれまでで最速のGeForce RTX GPUであるRTX 5090を公式発表しました。価格は14,000元から、中国版5090 Dは16,000元です。RTX 5090はFP4のサポートを追加し、メモリフットプリントは前モデルよりも小さく、生成AIモデルの実行速度は2倍に向上しています。この記事では製品の詳細な紹介をしています。続きを読むにはクリックしてください。

レポート全文はこちら:https://go.hyper.ai/dyyZS

人気のある百科事典の項目

  1. 核の規範
  2. 対応のあるt検定
  3. 大規模マルチタスク言語理解(MMLU)
  4. シグモイド関数
  5. 最小二乗法

この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。

https://go.hyper.ai/wiki

1月締め切りのトップカンファレンス

トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event

今週のエディターズピックはこれで終了です。hyper.ai公式サイトに掲載してほしいリソースがありましたら、ぜひコメントを残していただくか、作品をご提出ください。

来週お会いしましょう!

HyperAI (hyper.ai) について

HyperAI(hyper.ai)は、中国を代表する人工知能(AI)および高性能コンピューティング(Hyper-Physical Computing)コミュニティです。中国のデータサイエンス分野のインフラ構築に尽力し、国内の開発者向けに豊富で高品質な公開リソースを提供しています。これまでに以下の実績があります。

  • 1700以上の公開データセットの国内高速ダウンロードノードを提供
  • 500以上の古典的で人気のあるオンラインチュートリアルが含まれています
  • 200以上のAI4Science論文事例を理解する
  • 600 以上の関連用語の検索をサポートします。
  • 中国で初めて Apache TVM の完全な中国語ドキュメントをホスト

公式ウェブサイトにアクセスして学習を始めましょう:

https://hyper.ai