|
DeepSeek の価値は上がり続けています。過去 1 週間半の間に、次のような大きな出来事がありました。
春節期間中に3大通信事業者がDeepSeekを全面導入するなどのニュースも加わり、その影響はAIやインターネットだけにとどまらず、産業界のより深いレベルにまで及んでいます。 つまり、ユーザーと開発者は「サーバーがビジーです」というメッセージを心配する必要がなくなり、別のサーバーを試すことができるようになります。 公式サーバーが過負荷状態となり、DeepSeek-V3 API の割引が終了して価格が通常に戻ったため、大手クラウド サービス プロバイダーは利益を上げる機会をつかみました。 クラウドサービスのボリューム価格、新しいチップのボリューム速度Tencent Cloudは、オンライン検索をサポートするDeepSeekをリリースし、自社のSogou Searchと連携した検索強化APIを提供しています。 また、プライベート ナレッジ ベースとの統合もサポートしており、RAG のワンクリック統合が可能になります。 センスタイムとアリババが価格に直接影響を与えた。 SenseTime の大規模デバイス プラットフォームでは、3 か月間の期間限定で 1,000 万トークンを無料で使用できるほか、最大 128K のコンテキスト長制限もサポートされます。 Alibaba Cloud は新規ユーザーに 100 万トークンを無料提供しており、蒸留版モデルの価格も比較的低くなっています。 同時に、さまざまなチップが出力速度の面で激しい競争を繰り広げています。 汎用GPUに関しては、AMDの社員がMI300Xに搭載されている本格的なDeepSeek-R1が発売当初より3倍高速化していることを明らかにし、公式Dockerイメージを公開した。 NVIDIA と CUDA エコシステムに加えて、AMD と ROCm の代替手段も提供します。 3 つの主要な新しい AI 推論チップ Groq、Cerebras、Sampanova は、DeepSeek-R1-Distill Llama-70B ですでに 1 秒あたり 500 ~ 1500 トークンの速度を達成しています。 何が起こっているのかさえ見えないほど高速です。推論チェーンが完了し、コードが書かれ、瞬く間に実行されます。 △GroqチップはDeepSeek-R1-Distill Llama-70Bを実行していますもう一つもう 1 つの興味深いニュースは、ai.com ドメインが DeepSeek Web サイトにリダイレクトされるようになったことです。 DeepSeek が巨額の金額でドメイン名を取得したという噂さえある。 ただし、大規模なモデルをフォローしている人は、このドメイン名が以前は ChatGPT や xAI に関連付けられていたことを覚えているかもしれません。 これはドメイン所有者の個人的な行為である可能性が高いです。 国家スーパーコンピューティングインターネットプラットフォーム: https://www.scnet.cn/ Tencent Cloud DeepSeek 特集: https://cloud.tencent.com/dev... Alibaba Cloud DeepSeek ソリューション: https://www.aliyun.com/soluti... SenseTime 大型デバイス: https://www.sensecore.cn 参考リンク: [1]https://x.com/AnushElangovan/... [2]https://x.com/Dev_Digest/status/1887337604267332022 |
DeepSeek が National Supercomputing Platform で利用可能になりました。3 大通信事業者すべてに接続され、Pingtouge チップと互換性があります。
関連するおすすめ記事
-
わずか500万のデータでOpenAIを超える?Kuaishouが最新のコード埋め込みモデル「OASIS」をリリース。
-
AIが再びチェスの世界チャンピオンに勝利
-
LeCun 氏は、配列と完全な原子タンパク質構造を同時に生成するマルチモーダルタンパク質生成法である PLAID を提案したカリフォルニア大学バークレー校らの投稿を転送しました。
-
WeChat DeepSeekのエントリーポイントがオープンし、14億人のユーザーに到達しました!さっそくテストしてみましたが、Xin Qijiも絶賛するほどです!
-
オンライン チュートリアル | 最先端の (SOTA) イメージをワンステップで生成: Hyper-SD ワンクリック スタート チュートリアルが利用可能になりました。
-
O1の内部事情が突然暴露?Googleが先に原理を明らかにした。ソフトウェアだけの大規模モデルでは堀は作れない。