|
ミニモデルが再び登場!Microsoftが3つのオープンソースモデルを連続リリース!Phi 3.5では、異なるタスクに対応する3つのモデルがリリースされ、複数のベンチマークで他の類似モデルを上回る性能を発揮しました。 Phi-3.5-mini-instructは、メモリや計算能力が限られたデバイス向けに設計されており、小さなパラメータでも強力な推論能力を発揮し、コード生成や多言語理解といったタスクを容易に処理します。一方、Phi-3.5-vision-instructは、マルチモーダル分野のリーダーであり、テキスト情報と視覚情報を同時に処理できるため、画像理解や動画要約といったタスクを容易に処理できます。 HyperAIは、モデル展開チュートリアルのミニバージョンとビジョンバージョンを公開しました。リンクは下にスクロールしてください。 9月2日から9月6日までのhyper.ai公式ウェブサイトの更新の概要は次のとおりです。
公式サイトをご覧ください: hyper.ai オンライン学術交流イベントをおすすめします。上海交通大学のポスドク研究員である周子怡博士が、「タンパク質言語モデルのための少量学習法」について貴重な知見を共有します。登録して視聴するには、こちらをクリックしてください⬇️ https://hdxu.cn/6Bjom 厳選された公開チュートリアル 1. Phi-3.5-mini-instructのワンクリック展開 Phi-3.5-mini-instructは最大128Kトークンのコンテキスト長をサポートしており、コード生成、数学的問題解決、論理的推論などのタスクに適しています。このモデルは、多言語およびマルチターンの対話タスクにおいて非常に優れたパフォーマンスを発揮し、RepoQAベンチマークにおいて同クラスの他のモデルを凌駕しています。このチュートリアルでは、モデルのワンクリックデモデプロイを提供しています。コンテナをクローンして起動し、生成されたAPIアドレスをコピーするだけで、モデルを使った推論を体験できます。 直接使用する: https://go.hyper.ai/F7smR 2. Phi-3.5-vision-instructのワンクリック展開 Phi-3.5-vision-instructモデルは、画像理解、光学式文字認識(OCR)、グラフや表の解析、複数画像や動画クリップの要約といった幅広い機能を備えており、様々なAI駆動型アプリケーションに最適です。画像および動画処理ベンチマークにおいて、大幅なパフォーマンス向上が実証されています。モデルと環境は既にデプロイ済みで、ユーザーはチュートリアルの指示に従うだけで、この大規模モデルを推論や生成に直接使用できます。 直接使用する: https://go.hyper.ai/zN9Bx 3. オンラインチュートリアル | 1 分で 10,000 語のサスペンス小説を生成する: LongWriter-glm4-9b は長いテキスト出力のボトルネックを突破します。 LongWriterは清華大学が開発したオープンソースプロジェクトで、長文コンテキスト大規模言語モデル(LLM)を用いて非常に長いテキスト(10,000文字以上)を生成します。このチュートリアルでは、モデルのワンクリックデプロイデモをご紹介します。コンテナをクローンして起動し、生成されたAPIアドレスをコピーするだけで、モデルを使った推論を開始できます。 直接使用する: https://go.hyper.ai/p6SiO 選択された公開データセット 1. MRR-Benchmark マルチモーダル読解ベンチマークデータセット マルチモーダル リーディング (MMR) ベンチマークは、テキスト、フォント、視覚要素、境界ボックス、空間関係、基礎を網羅する 11 の異なるタスクにわたる 550 の注釈付き質問と回答のペアで構成され、慎重に設計された評価メトリックを備えています。 直接使用する: https://go.hyper.ai/deAmf 2. EveDentify瞳孔径推定データセット このデータセットには、51人の被験者から撮影された212,073枚の画像が含まれています。研究チームは、Tobiiアイトラッカーを用いて正確な瞳孔径の測定値を収集するとともに、内蔵ウェブカメラで顔の動画も撮影しました。このデータセットは、一般的なウェブカメラ画像を用いた瞳孔径推定のためのデータセットが不足している現状を解消することを目的としています。 直接使用する: https://go.hyper.ai/iHjxC 3. 交通道路物体検出:ポーランドの交通道路物体検出データセット このデータセットには、物体検出タスク用に特別に編集された、ポーランドの道路のアノテーション付き画像11,000枚が含まれています。データは、主にクラクフのポーランドの道路で車載カメラを使用して収集されました。画像は、様々な道路の種類や様々な照明条件(昼夜)を含む、多様なシーンを捉えています。 直接使用する: https://go.hyper.ai/Sl0k5 4. C2A災害シナリオにおける人間検出データセット C2A(アプリケーションに結合)データセットには、4 つの災害シナリオ タイプ(火災/煙、洪水、倒壊した建物/瓦礫、交通事故)と 5 つの人間の姿勢カテゴリ(かがむ、ひざまずく、横になる、座る、立つ)にわたる 10,215 枚の高解像度画像が含まれており、画像解像度は 123×152 から 5184×3456 ピクセルまで、注釈付きの人間のインスタンスは 360,000 を超えます。 直接使用する: https://go.hyper.ai/15dMR 5. 皮膚状態データセット: 6 つの皮膚状態データセットを含むデータセット。 このデータセットには、ニキビ、がん、湿疹、角化症、稗粒腫(ミリア)、酒さ(ロザケア)の6種類の皮膚疾患の鮮明画像が含まれています。各カテゴリには399枚の画像が含まれており、合計2,394枚の画像となります。 直接使用する: https://go.hyper.ai/tWO7x 6. ペン・フーダン歩行者検出・セグメンテーションデータセット このデータセットには、動画シーケンスから抽出された170枚の高解像度RGB画像が含まれており、各画像には0~6人の歩行者ターゲットが含まれています。各歩行者の位置は境界ボックス(マスク)で正確にラベル付けされており、境界ボックスの座標情報を提供することで、物体検出のトレーニングとテストを容易にします。 直接使用する: https://go.hyper.ai/1CqaN 7. 電気機器廃棄物のTecnaliaハイパースペクトルデータセット Tecnaliaハイパースペクトルデータセットには、銅、真鍮、アルミニウム、ステンレス鋼、白銅など、電気電子機器廃棄物から得られた様々な非鉄金属成分が含まれています。画像には、スペクトル範囲[415.05 nm、1008.10 nm]内で均一に分布した76の波長が含まれています。 直接使用する: https://go.hyper.ai/1TBGz 8. 自動車事故予測データセット このデータセットには、10万本のダッシュカムビデオから抽出された1万枚のダッシュカム画像が含まれています。画像はビデオから5秒間隔で切り離され、個別のフレームを形成しています。データセットには衝突クラスと非衝突クラスの両方が含まれており、アノテーションはxlsxファイルに提供されています。 直接使用する: https://go.hyper.ai/jV1hL 9. PKU-Market-PCBプリント基板欠陥データセット PKU-Market-PCB は、6 種類の欠陥 (ビア、ネズミの噛み跡、断線、短絡、漂遊線、銅の汚れ) を含む 1,386 枚の画像を含む公開合成 PCB データセットであり、画像の検出、分類、登録タスクに使用できます。 直接使用する: https://go.hyper.ai/VnbpT 10. PKU-Market-Phone 携帯電話画面表面欠陥セグメンテーションデータセット このデータセットには、油染み、傷、シミの3種類の表面欠陥が含まれています。各欠陥ごとに400枚の画像があり、合計1.2k枚の画像があります。これらの欠陥は、研究チームが産業環境をシミュレートして作成したものです。画像は、産業用カメラを用いて1920×1080の解像度で撮影されました。データセットは、トレーニング:検証:テストの比率が6:2:2で分割されており、データセット形式はPASCAL VOCです。 直接使用する: https://go.hyper.ai/K6u2o その他の公開データセットについては、以下をご覧ください。 https://hyper.ai/datasets 厳選されたコミュニティ記事 1. AlphaFold 3 の徹底的な分解: 上海交通大学の Zhong Bozitao: データを最大限に活用して、すべての生体分子の構造を原子レベルの精度で予測していますが、完璧ではありません。 最近、上海交通大学で開催されたAIバイオエンジニアリングサマースクールにおいて、鍾博子涛博士が「AlphaFold 3:原理、応用、そして展望」と題したプレゼンテーションを行いました。博士は自身の学習経験を体系的にまとめ、科学界における数多くの関連研究成果を幅広く収集し、AlphaFold 3に関する深い洞察を共有しました。本稿では、博士のプレゼンテーションの中核となる内容を要約します。 レポート全文はこちら:https://go.hyper.ai/Ln2Yv 2. 米国科学アカデミー紀要の表紙記事!中国チームがウェハレベル製造AI適応型マイクロ分光計を発表。 復旦大学の研究チームは、従来の分光計と計算再構成分光計の利点を組み合わせた、革新的な小型再構成分光計の設計を提案しました。この設計は、統合された自己参照型狭帯域フィルタチャネルを通じて、人工知能アルゴリズムが高次元パラメータ空間においてスペクトルとアルゴリズムパラメータを同時に探索することを可能にします。本稿では、この研究論文の詳細な解釈と共有を提供します。 レポート全文はこちら:https://go.hyper.ai/GEKE4 3. 上海 AI ラボは、700 万の質問と回答のデータ ポイントをカバーし、GPT-4 に匹敵する専門的な機能を備えた ChemLLM をリリースしました。 上海人工知能研究所は、化学分野における大規模言語モデル「ChemmLM」をリリースしました。ChemmLMは、流暢な対話を通じて化学分野の様々なタスクを遂行することに優れています。コアタスクにおけるパフォーマンスはGPT-4に匹敵し、一般的なシナリオでは同規模のLLMに匹敵するパフォーマンスを発揮します。本稿では、この研究論文の詳細な解釈と概要をご紹介します。 レポート全文はこちら:https://go.hyper.ai/3bdMW 人気のある百科事典の項目 1. RRFと組み合わせた逆ソート 2. 学習率 3. 核の規範 4. パレートフロント 5. データ拡張 この編集版には何百もの AI 関連用語が含まれており、「人工知能」を理解するのに役立ちます。 https://go.hyper.ai/wiki トップ AI 学術会議を一か所で追跡: https://go.hyper.ai/event 今週のエディターズピックはこれで終了です。hyper.ai公式サイトに掲載してほしいリソースがありましたら、ぜひコメントを残していただくか、作品をご提出ください。 来週お会いしましょう! HyperAI (hyper.ai) について HyperAI(hyper.ai)は、中国を代表する人工知能(AI)および高性能コンピューティング(Hyper.ai)コミュニティであり、中国のデータサイエンス分野のインフラとなることを目指し、国内の開発者向けに豊富で高品質な公開リソースを提供しています。これまでに以下の実績があります。
公式ウェブサイトにアクセスして学習を始めましょう: https://hyper.ai/ |
Phi 3.5 mini+vision をワンクリックで導入! マルチモーダル読解ベンチマークデータセット MRR-Benchmark がオンラインになりました。550 組の質問と回答が含まれています。
関連するおすすめ記事
-
知性の世界を実現する | 学習リソースを全面的にアップグレードし、共に技術成長への道を築く
-
カンファレンスのスケジュールが発表されました | 今週末、上海で開催される PyCon China 2024 でお会いしましょう!
-
21歳の天才が立ち上げたAIハードウェアのスタートアップが一夜にして話題に。首にかけるAIの友達が710元で手に入る。
-
[Triton チュートリアル] 融合ソフトマックス(Fused Softmax)
-
南京の AI プラットフォームは大幅なアップグレードを誇り、システム間呼び出しの成功率が 99.2% で 100 台を超えるインテリジェント エージェントをサポートします。
-
Intel と AMD が今世紀に向けて力を合わせます。AI と Lenovo のおかげ。