618ZXW

Zhipu AI の回答: 米国のエンティティ リストに追加されました。

オリジナル Datawhale Datawhale

データホエールの共有

最新情報:Zhipu AI、エンティティリストの影響

2日前のものと全く同じ発表がまた届きました!たった今、米国が初の世界的なAI禁止令を正式に発令しました!

現在、中国のAIに対する米国の規制はチップから他の分野にも広がりつつある。

早朝、米国商務省産業安全保障局(BIS)が輸出管理組織リストを更新した。

更新された輸出管理エンティティリストに「Zhipu AI」が追加されました。

Zhipu AIは完全にブラックリストに登録されました。

BISは最初の文書で、11社の中国のAI企業をエンティティリストに追加したが、そのうち10社はZhipuの子会社である。

△ エンティティリスト掲載企業一覧、出典:Digital Life Kazik

文書に記載されている理由は次のとおりです。

これらの団体は、高度な人工知能研究の開発と統合を通じて、中国の軍事力近代化を推進しています。こうした活動は、米国輸出管理規則(EAR)第744.11条に基づき、米国の国家安全保障および外交政策上の利益を侵害するものです。

ジーナ・マリー・ライモンド米商務長官は別の声明で、「これらの規則は我々の管理をさらに強化し、中国が米国の安全保障にいかなる脅威も及ぼさないことを保証するだろう」と述べた。

🇺🇸真のホワイトハウスセレクション🐮

これに対し、Zhipu AIは公式声明を発表した。

「チェーン全体の大規模モデルのコア技術を習得」し、独立性と制御性を持つことが、Zhipuの自信の基盤です。

制裁にもめげず、3つの主要モデルが次々と発売された。

その日の午後、Zhipu AI も 3 つの新しいモデル (Realtime、Air、4V-Plus) をリリースし、大きな反響を呼びました。

GLM-RealtimeとGPT-4oの直接比較

GLM-Realtimeは、新たにリリースされたエンドツーエンドモデルです。動画コンテンツをリアルタイムで理解し、最大2分間のメモリをサポートし、ユーザーが動画に話しかけることで、現実世界や物理世界で目にするものと直接インタラクションできます。音声インタラクションに関しては、革新的なアカペラ歌唱機能を実装し、大型モデルが会話中に歌唱することを初めて可能にしました。

さらに、Realtimeは関数呼び出し機能をサポートしています。独自の知識と機能を活用するだけでなく、外部の知識やツールも柔軟に活用することで、より幅広いビジネスシナリオへの適用範囲を拡大します。

これにより、可能性は大きく広がります。未来のエージェントを想像してみてください。誰もがAIアシスタントを持ち、日常生活の様々な問題を解決してくれるのです。例えば、北京に行きたいなら、天気予報を教えてくれたり、ホテルの予約を手伝ってくれたりします。

GLM-4-Air 完全アップグレード

Zhipu AIは、対話とテキスト作成の実際のニーズに基づいて、GLM-4-Airの全面的なアップグレードを実施し、GLM-4-Air-0111を開発しました。

このバージョンでは、トレーニングデータとプロセスの徹底的な最適化が特徴となっています。アルゴリズムの改良により、特定の次元においては、より大規模モデルであるGLM-4-Plusに匹敵する性能を実現しています。

一方、モデル構成は合理化されており、過剰なリソース消費を効果的に回避しています。特に、前バージョンと比較して呼び出しコストが半減し、開発と導入のコストプレッシャーが大幅に軽減されていることは注目に値します。

GLM-4V-Plus 完全アップグレード

GLM-4V-Plus は視覚理解機能をアップグレードします。

新バージョンは最大2時間の動画を認識できる能力を誇り、幅広い互換性を備えています。224×224の低解像度画像から4K超高精細の高解像度画像まで対応し、極めて広いアスペクト比の画像にも対応します。

GLM-4V-Plus は、効率的な認識を保証しながら、トークンの消費を削減します。

複数の公開ベンチマークテストにおいて、GLM-4V-Plus は以前のバージョンと比較して大幅なパフォーマンスの向上を示しました。

すべての人にAIを加速させ、中国の声を届ける

Zhipuは、社会全体に向けて、無料でアクセス可能なインクルーシブなモデルAPIのFlashシリーズを公開しました。業界初のフルモーダルモデルの無料シリーズとして、開発者は言語、マルチモーダル理解、マルチモーダル生成機能を無料で利用できます。

Zhipu は現在、誰でも使用できる新しい「Flash All-Modal Suite」をリリースしており、これには次のものが含まれています。

GLM-4-Flash 言語モデル: インテリジェントな質問応答、要約生成、テキスト データ処理などのシナリオに適しています。

GLM-4V-Flash 画像理解モデル: 画像認識、画像質問回答、画像推論などのシナリオに適しています。

Cogview-3-Flash 画像生成モデル: 芸術的創造、デザイン参照、ゲーム開発、仮想現実などの分野に応用されます。

CogVideoX-Flash ビデオ生成モデル: テキストベースのビデオをサポートし、入力されたテキストの説明に基づいて対応する動的なビデオ コンテンツを生成します。また、画像ベースのビデオもサポートし、入力画像を詳細に分析して、画像から重要な情報、要素の特徴、潜在的な意味を抽出できます。

最後に、次のことを述べたいと思います。

米国からの制限に直面しても、Zhipu AIは後退するどころか、進歩を加速させた。

3 つの主要モデルの立ち上げと包括的モデルのアップグレードは、すべての人のための AI の時代に貢献しています。

私たちの能力を活用することで、物理的な組織の制約から解放され、中国の声を届けることができます。

もう一つ

国産大型モデルのサポート、まずは自分たちから。

Datawhale は、「Smart Spectrum AI」(初心者向けガイド) の実践的なチュートリアルを丁寧に準備しました。

Datawhale のメンバーであり、教育分野の専門家として、私の観点から Zhipu の無料モデルの効果のいくつかを共有したいと思います。

GLM-4V-Flash モデルの課題を評価する方法に関するチュートリアルを紹介します。

その他のモデルとソリューションはチュートリアルで更新されます。チュートリアルは次の場所にあります: https://spvrm23ffj.feishu.cn/...

△ 宿題の添削

GLM-4Vフラッシュ

import gradio as gr

結果ショーケース