唯一のオープンソース70B Llama 3.3モデルをオンラインで実行できます。405Bモデルに匹敵するパフォーマンスを実現！数式認識に役立つLaTeX OCRデータセットもオンラインで利用可能になりました。

今月、MetaはLlama 3.3向けの唯一のオープンソースモデルであるLlama-3.3-70B-Instructをリリースしました。パラメータサイズはわずか70バイトですが、パフォーマンスは405バイトモデルに匹敵します。これはLlama 3シリーズの最終モデルであり、Zuckerberg氏はLlama 4で終わりを迎えると述べました。

hyper.aiウェブサイトに「Llama-3.3-70B-Instructのワンクリックデプロイ」のチュートリアルセクションが開設されました。Llama 3の最終章を一緒に体験しましょう！

オンラインで使用: https://go.hyper.ai/TthEw

12月23日から12月29日までのhyper.ai公式サイトの更新内容の概要は次のとおりです。

高品質の公開データセット: 10
厳選された高品質のチュートリアル：3
選択されたコミュニティ記事: 6
人気の百科事典の項目: 5
1月締め切りのトップカンファレンス：9

公式サイトをご覧ください： hyper.ai

選択された公開データセット

1. CompreCap画像記述データセット

データセットには 560 枚の画像が含まれており、それぞれの画像には細かいセマンティックセグメンテーションとオブジェクト、属性、関係の注釈が付けられ、完全な方向性のあるシーングラフ構造が形成されています。

直接使用する: https://go.hyper.ai/icfaH

データセットの例

2. HelmetViolationsヘルメット認識データセット

このデータセットには、YOLOv9形式でアノテーションされた合計1,004枚の画像が含まれており、プレート、ヘルメットあり、ヘルメットなしの3つのカテゴリに分類されています。トレーニングセットには363枚の画像（RAW画像と拡張画像）、検証セットには53枚の画像が含まれています。テストセットは、モデル評価用にエクスポートされたデータセットに含まれています。

直接使用する: https://go.hyper.ai/N0Yyg

データセットの例

3. SynCamVideo-Dataset: 複数カメラ同期ビデオデータセット

このデータセットには、36台のカメラで撮影された1,000の異なるシーンが含まれており、合計36,000本の動画が生成されています。50種類の動物が「主要被写体」として登場し、Poly Havenの20の異なる場所が背景として使用されています。

直接使用する: https://go.hyper.ai/oIJns

データセットの例

4. 飛行機画像分類データセット

このデータセットには 3,371 枚の航空機画像が含まれており、それぞれが特定の航空機モデル (A10、A400M、AG600、AH64、AV8B、An124、An22、An225、An72、B1 など) に対応する 10 個のカテゴリフォルダーに分かれています。

直接使用する: https://go.hyper.ai/IL3uP

データセットの例

5. MangaZeroコミック画像データセット

MangaZeroデータセットは、コミック生成タスク向けに特別に設計された、大規模で複数キャラクター、複数状態のコミック画像データセットです。43,264ページのコミックと427,147枚の注釈付きコマが含まれており、連続するフレームにおける様々なキャラクターのやり取りや行動の視覚化をサポートし、複数キャラクター、複数状態のコミック生成タスクに適しています。

直接使用する: https://go.hyper.ai/IpkjL

6. LaTeX OCR数式認識データセット

LaTeX OCRデータセットは、光学文字認識（OCR）分野における複雑な数式認識の問題に焦点を当てたデータセットです。LaTeX OCRデータセットには、それぞれ異なる特徴とデータ分割を持つ複数の構成が含まれています。

直接使用する: https://go.hyper.ai/lyK1J

7. FSQ OS Places オープンソース位置情報データセット

このデータセットには、200以上の国と地域を広くカバーする1億以上の世界規模のPOI（Point of Interest）が含まれており、研究者、開発者、企業が豊富な地理空間データにアクセスすることを可能にします。地名、住所、緯度/経度などの重要な情報を含む22のコア属性が提供され、地理空間分析や位置情報サービスなどの様々なアプリケーションをサポートします。

直接使用する: https://go.hyper.ai/7oN5M

8. ProcessBench 数学推論ベンチマークデータセット

このデータセットには、競技レベルおよびオリンピックレベルの数学問題に焦点を当てた3,400件のテストケースが含まれています。各ケースにはステップバイステップの解答が付属しており、ドメインエキスパートによってエラーが正確に指摘されています。

直接使用する: https://go.hyper.ai/fk3hq

9. 中国医学対話データセット

この中国語医療データセットは、医療分野における専門的な対話とアドバイスを提供できる言語モデルの開発とトレーニングのための包括的なリソースです。百科事典の知識、教科書のテキスト、実際の医師と患者の対話、評価データなど、様々な種類のデータを組み合わせ、モデルの精度と使いやすさを向上させることを目指しています。

直接使用する: https://go.hyper.ai/wkAXX

10. SplsoNet異方性補正とミスアライメント補正チュートリアルデータセット

spIsoNetは、最適配向問題に起因する地図異方性および粒子転位の問題を解決するために使用される、エンドツーエンドの自己教師ありディープラーニングソフトウェアです。このデータセットは本研究で使用されたデータセットであり、関連結果は国際学術誌Nature Methodsに掲載されています。

直接使用する: https://go.hyper.ai/tFOqJ

厳選された公開チュートリアル

1. Llama-3.3-70B-Instructのワンクリック展開

Llama-3.3-70B-Instructは、Metaが2024年にリリースした大規模言語モデルです。現在、Llama 3.3シリーズで唯一のオープンソースモデルであり、微調整された命令を備えた特別に最適化されたバージョンを備えています。

モデルは環境と依存関係が設定されています。APIアドレスにアクセスすることで、モデルとの対話を開始できます。

オンラインで実行: https://go.hyper.ai/TthEw

モデル例

2. HunyuanVideo (Tencent Hunyuan Wensheng ビデオデモ)

HunyuanVideoは、人工知能技術を用いてユーザーが高品質な動画コンテンツを作成できるよう支援することを目指しています。130億ものパラメータを備えたHunyuanVideoは、現在、オープンソースモデルとしては最大のパラメータ数を有し、高い物理的精度とシーンの一貫性を備えた動画コンテンツを生成し、ユーザーに超リアルな視覚体験を提供し、現実と仮想のスタイルを自由に切り替えることができます。

このプロジェクトはユーザーフレンドリーな Web インターフェイスを提供しており、ユーザーはテキストの説明や条件の指定だけでさまざまなスタイルのビデオを生成できます。

オンラインで実行: https://go.hyper.ai/hEkOw

モデル例

3. Tritonチュートリアル: 行列の乗算

このチュートリアルでは、cuBLASやrocBLASに匹敵する、非常に簡潔で高性能なFP16行列乗算カーネルを作成します。具体的には、多段行列乗算、多次元ポインタ演算、L2キャッシュヒット率を向上させるプログラム並べ替え、自動パフォーマンスチューニングについて学習します。

オンラインで実行: https://go.hyper.ai/riM7b

行列乗算の例

厳選されたコミュニティ記事

1. AIが材料化学に革命を起こす：2024年の注目すべき科学的成果の概要

HyperAIは、2023年から2024年にかけて発表された26本の最先端の論文を厳選し、カテゴリー分けしました。この記事では、材料化学分野におけるAI研究に焦点を当て、包括的な概要を提供しています。クリックして今すぐご覧ください。

レポート全文はこちら：https://go.hyper.ai/XnzcN

2. 化学のチューリングマシンを目指して！AI搭載製薬会社Chemifyが世界初の化学コンパイラを開発し、米国市場に進出。

英国のハイテク化学企業であるChemifyは、世界初の「化学チューリングマシン」と世界初の化学コンパイラを開発しました。化学計算、人工知能、ロボット工学、自動化を医薬品開発に統合し、化学のデジタル化を推進することに注力しています。この記事では、同社に関する詳細なレポートを掲載しています。続きを読むにはクリックしてください。

レポート全文はこちら：https://go.hyper.ai/V5VWB

3. 超大規模病理画像の解析に！華中科技大学は、シェーグレン症候群の診断精度を向上させるための医療画像セグメンテーションモデルを提案しています。

華中科技大学の屠偉教授と陸鋒教授は、シェーグレン症候群患者の病理画像におけるリンパ球凝集巣を正確に識別できる医療画像セグメンテーションモデルを提案しました。このモデルは、医師がより迅速かつ正確な診断を行うのに役立ちます。本記事では、両教授の論文を詳細に解釈し、共有します。

レポート全文はこちら：https://go.hyper.ai/EetpB

4. 具現化された知能と触覚革命の未来！TactEdgeセンサーは、ロボットが正確な触覚認識を持つことを可能にし、布地の欠陥検出と器用な操作制御を実現します。

中国地質大学（北京）の張世欣率いるチームは、2014年から視覚触覚センサーの研究に取り組んでおり、複数世代のセンサー技術の探究と開発に取り組んでいます。彼らはこれを最先端の触覚技術「TactEdge」と呼んでいます。この記事では、彼らの研究成果について詳しく紹介しています。続きを読むにはクリックしてください。

レポート全文はこちら：https://go.hyper.ai/nOE2a

5. 2024年の医療AIブレークスルーレビュー：必読の最先端論文35選

この記事では、ヘルスケア分野におけるAI研究に焦点を当て、2023年から2024年にかけて発表される35本の最先端の論文を厳選してご紹介します。非常に有益な情報ですので、ぜひクリックしてご覧ください。

レポート全文はこちら：https://go.hyper.ai/CZdYT

6. LeCun は、配列と完全な原子タンパク質構造を同時に生成する PLAID マルチモーダルタンパク質生成法を提案した UC Berkeley らの投稿を転送しました。

カリフォルニア大学バークレー校、マイクロソフトリサーチなどの研究チームは、PLAIDと呼ばれるマルチモーダルなタンパク質生成手法を提案しました。この手法は、より豊富なデータモダリティからより希少なモダリティを生成することで、マルチモーダルなタンパク質生成を実現します。本稿では、この論文の詳細な解釈と共有を提供します。

レポート全文はこちら：https://go.hyper.ai/nwnDy

人気のある百科事典の項目

1. シグモイド関数

2. RRFと融合した逆ソート

3. 核の規範

4. 大規模言語モデル

5. 長期短期記憶

この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。

https://go.hyper.ai/wiki

トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event

今週のエディターズピックはこれで終了です。hyper.ai公式サイトに掲載してほしいリソースがありましたら、ぜひコメントを残していただくか、作品をご提出ください。

来週お会いしましょう！

618ZXW

唯一のオープンソース70B Llama 3.3モデルをオンラインで実行できます。405Bモデルに匹敵するパフォーマンスを実現！数式認識に役立つLaTeX OCRデータセットもオンラインで利用可能になりました。

関連するおすすめ記事

ランダムにおすすめされた記事

人気のタグ