618ZXW

話題のトップトピック!DeepSeekはAI人材の採用に数百万ドルの年俸を提示。インターンでも月1万元以上稼げる。

DeepSeek では人材を募集しており、そのニュースがトレンド検索のトップにランクインしました。

何ですか?専攻や経験に制限はなく、大学を卒業したばかりの人でも年間100万ドルの収入を得られるんです。

BOSSプラットフォームに最初に公開された求人情報から、最高給与は11万ドル×14に達し、学部生の最高給与は9万ドル×14であったことがわかります。

インターンも1日500元から採用され、月に20日働けば月1万元、最高日給は1000元だ。

多くのネットユーザーが羨望の涙を流すのも不思議ではない。

AIは初期のインターネットのようなもので、この時代の恩恵を受けるのは他の誰かになるだろうと指摘する人もいます。

しかし、記事執筆時点では、DeepSeek の BOSS プラットフォーム上の求人広告は削除されており、具体的な理由は現在のところ不明です。

もちろん、この機会を利用して DeepSeek の採用要件と人材哲学を詳しく調べることを止めるものではありません。

学士号取得者が望ましいです。経験は考慮されず、能力のみが考慮されます。

DeepSeek の求人情報を注意深く読むと、修士号を必要とするいくつかの職種を除けば、ほとんどの職種で学士号以上が必要であることがわかります。

さらに、ヒーローはあらゆる分野から来ています。専攻や職歴に関係なく、DeepSeek はあなたを歓迎します。

コアシステムの研究開発エンジニアの場合でも、年収9万人民元、14か月分の給与、つまり年間126万人民元を得るには、やはり学士号が最低条件となる。

実際、この基準に従うのは新入社員だけではなく、DeepSeek の既存のチームも非常に若いです。

DeepSeekが昨年初めにV2をリリースしたとき、R1ほどの圧倒的な人気はなかったものの、それでも業界ではかなりの注目を集めました。

当時、Anthropic の共同設立者である Jack Clark 氏は、DeepSeek v2 の背後には「計り知れない天才たち」の集団がいるに違いないと信じていました。

しかし、DeepSeekの創設者であるLiang Wenfeng氏はインタビューでこの憶測をすぐに否定した。

彼らの中には計り知れないほどの天才はおらず、ほとんどが一流大学を卒業したばかりの学生や、まだ卒業していない博士課程の4年目または5年目の研修生、そして数年前に卒業したばかりの若者たちです。

現在、v3 と R1 でも同様で、最近の卒業生や在校生、特に清華大学と北京大学の学生が非常に活躍しています。

彼らの中には、2024年にDeepSeekで研究を行っており、ちょうど博士論文が賞を受賞したばかりの人もいました。

DeepSeek が開発した新しい注目度 MLA (Multi-Head Latent Attention) や GRPO 強化学習アライメント アルゴリズムなどの重要なイノベーションは、すべて若い人たちによって生み出されました。

中には、短期間のインターンシップで大きな成果を達成した人もいます。

例えば、最近、世界最高峰のカンファレンスであるICLR 2025に採択された論文では、強化学習とモンテカルロ木探索を用いた数学的証明に特化したモデルが開発されました。このモデルは、関連データセット(miniF2F-valid)において60.2%の合格率を達成しましたが、GPT-4はわずか25%でした。

この論文の筆頭著者はDeepSeekのシニアインターンでした。彼は昨年前半にDeepSeekでインターンシップを行い、インターンシップ終了直後に論文が初公開されました。現在、著者は博士課程に進学しています。

これは、DeepSeek がインターン生に数千元の日給を提供する意思がある理由を説明しているのかもしれない。

梁文鋒氏はインタビューの中で、ディープシークが経験の浅い若者を大胆に雇用する理由を説明した。

短期的な目標に焦点を当てるなら、経験豊富な人材を採用するのが正しいアプローチです。しかし、長期的な視点で考えると、経験はそれほど重要ではなく、むしろ基本的なスキル、創造性、そして情熱が重要になります。当社の採用方針の一つは、経験ではなく能力を重視することです。

DeepSeek の採用要件を振り返ると、「制限がない」ように見えるポジションが、実はまったく単純ではないことが容易にわかります。

さまざまな AI モデルを徹底的に理解し、関連するプログラミング言語を習得する必要があるだけでなく、一部のポジションでは、トップジャーナルへの論文掲載や有名なコンテストでの受賞も求められます。

このように、DeepSeek チームは比較的若く経験が浅いにもかかわらず、その能力と実績は注目に値します。

DeepSeek を OpenAI と同じテーブルに導いたのは、この若いチームでした。

実際、DeepSeek が若い世代にアピールする理由は、年齢だけにとどまりません。

事前に定義されたタスクは必要ありません。コンピューティング リソースは誰でも利用できます。

求人広告の観点から見ると、「フルスタック エンジニア」は DeepSeek の求人広告のかなりの部分を占めています。

重要な点は、職務内容にそれほど多くの制限がないことです。

求人広告から判断すると、DeepSeek の社内管理モデルも冷静さを重視しているようです。

梁文鋒氏は、DeepSeekに採用された社員は「放任主義」のアプローチを取ると説明した。重要な業務は任されるものの、KPIの設定や介入は一切なく、自ら解決策を見つけ、自ら成長していくことが認められる。

もちろん、DeepSeek はこのプロセスにおける人員と計算能力のニーズを満たします。

各人が割り当て可能なカード数や人員数に制限はありません。アイデアがあれば、誰でもいつでも承認なしでトレーニングクラスターのカードにアクセスできます。さらに、階層構造や部門横断的な組織構造がないため、関心のある人であれば誰でも柔軟に活用できます。

前述の MLA アテンション メカニズムは良い例です。その出現はまったくの偶然でした。

梁文鋒氏は、注目アーキテクチャの主流の進化パターンをいくつかまとめた後、この若者は突然代替案を設計するというアイデアを思いついた、と説明した。

この「偶然の出会い」に直面して、DeepSeek は全面的にサポートし、数か月かけてこのアイデアを現実のものにするために専任チームを結成しました。

さらに深く掘り下げてみると、DeepSeek の中核も若々しく、非常に理想主義的であるように思われます。

Liang Wenfeng氏は、DeepSeekの目標は非常に明確であり、垂直的なカテゴリやアプリケーションに焦点を当てるのではなく、研究と探索を行うことだと述べました。

多くの大規模起業家がアプリケーションへと移行する傾向が強まっていることを考えると、そのような選択は困難になる可能性が高い。

しかし、DeepSeek の観点から見ると、大規模モデルの構築は、必ずしも既存のモデルをコピーして手っ取り早く利益を得ることに頼るのではなく、真の技術革新を推進するものになるはずです。

これは別の観点から見ると、DeepSeekチームの若さの主な理由を説明しています。

経済的利益が優先されない場合、イノベーションの基盤となるのは確信であり、若者は間違いなく最も自信と活力のあるグループです。

GPU が何万台もあるのに、法外な給料を提示する人がいても不思議ではありません。

理想を持つなら、当然それに投資すべきです。実際、DeepSeekは人材とコンピューティングリソースの両面において、惜しみない投資を行ってきました。

前述したように、DeepSeek はコンピューティング リソースを誰もが利用できるという考えを推進しており、採用資料では関連するコンピューティング パワーのサポートについて明示的に言及しています。

では、DeepSeek は実際にはどの程度の計算能力を持っているのでしょうか?

有名な半導体研究機関Seminalysisが発表したレポートを分析すると、次のことがわかります。

(レポートの推測に基づくと) DeepSeek は約 50,000 台の Hopper GPU を所有しており、GPU への投資額は 5 億ドルを超えています。

(Hopper GPU は、高性能コンピューティングと AI 向けに特別に開発された NVIDIA の次世代データセンター GPU アーキテクチャです。コンピューター科学者の故 Grace Hopper 氏に敬意を表して命名されました。)

しかし、レポートでは、50,000 個の Hopper GPU ≠ 50,000 個の H100 についても注意を促しています。

具体的には、 DeepSeek が約 10,000 台の H800 と約 10,000 台の H100 を保有しており、さらに H20 も発注しているとレポートでは推測されています。

これらの GPU は、Magic Quantization (DeepSeek の背後にある会社) と DeepSeek で共有されます。

同時に、このレポートでは、これまで広く流布していた「DeepSeek V3のトレーニングコストはわずか600万ドルだ」という主張についても説明している。

この数値は実際には片側だけのものです。これは事前学習プロセス中のGPUコストのみを表しており、モデルの総コストの一部にすぎません。

研究開発費やハードウェア自体の総所有コストなどの重要な要素は含まれていません。

具体的には、レポートの分析では、DeepSeek のハードウェア支出が 5 億ドルをはるかに超えており、新しいアーキテクチャを開発するためにチームがかなりの金額と計算能力を費やす必要があることが示唆されています。

たとえば、DeepSeek のコスト削減の鍵となる MLA メカニズムは、初期段階では多大な人的資源と GPU コンピューティング時間の投資を必要とし、数か月を要しました。

もちろん、この投資は報われました。その後の研究開発により、クエリごとに必要なキーバリューキャッシュは約93.3%削減されました。

したがって、前述のハードウェアと人件費を考慮しても、DeepSeek はコスト効率の面でまだかなり改善の余地があります。

春節休暇が終わる前でさえ、Tencent Cloud、Alibaba Cloud、Baidu Smart Cloud などの主要なクラウド コンピューティング プロバイダーは、ここ数日、DeepSeek モデルのリスト登録に奔走しています。

これほど大きな注目を浴びているのだから、人材を採用するために法外な給料を提示できるのも不思議ではない。

参考リンク:[1] https://semianalysis.com/2025... [2] https://www.zhipin.com/gongsi... [3] https://finance.sina.com.cn/t...