|
鄭サイズデータクジラ Datawhale体験 著者: Zheng Sze-tse、北京大学 PhD、ByteDance TopSeed 知书:鄭則澤、著者の許可を得て掲載 アドレス: https://zhuanlan.zhihu.com/p/... 博士号を取得して6ヶ月が経ちました。この1年間は、葛藤と決断の迷いに満ちた、まさに人生の旅でした。最近、就職活動の経験を共有する機会をいただきましたが、スケジュールの都合で参加できませんでした。そこで、今日は休みを利用して、この期間の自分の気持ちや経験を書き留めておこうと思います。私の選択の中には正しいものもあれば、間違ったものもありましたが、将来振り返ってみると、きっと役に立つはずです。 私は2024年7月に博士号を取得しました。就職活動は2023年の春節後に始めました。基本的に、積極的に連絡をくれた企業にのみ連絡を取りました。最初に連絡を取ったのは、Huaweiのコンピューティング製品ラインのコンピューティング研究部門にあるAscend LabsとKunpeng Labsでした。その後、上海人工知能研究所とMagic Square AI(年末にDeepseekに改名)にも連絡を取りました。さらに、当時私はByteDanceでインターンシップをしており、リーダーから正社員のオファーの可能性があると言われました。つまり、当時は4つの選択肢がありました。上海人工知能研究所とMagic Square AIはどちらも具体的な職位と給与を提示してくれましたが、ByteDanceからは給与や職位は明示されずに口頭でオファーがありました。しかし、当時の私の目標はHuaweiで働き、国産チップの開発に携わることだったので、3つのオファーすべてを保留にしました。 残念ながら、私は2023年9月に交換留学に行き、新卒向けの就職活動には参加しませんでした。ファーウェイのオフラインネットワーキングイベントにも参加できず、ファーウェイのコンピューティング研究部門からのオファーも未確定のままでした。クラスメートはすでにオファーを獲得していましたが、私が行きたい場所からは明確な情報がありませんでした。他の企業に積極的に応募しておらず、受信トレイに殺到するヘッドハンターのメッセージに返信していませんでした。私はパニックになり始め、急いで追いつこうとしました。さまざまなヘッドハンターや人事担当者からのメールに返信し、ファーウェイのグローバルサービス部門、2012、HiSilicon、端末メーカー、そしてBaidu、Alibaba、Tencentなどのインターネット大手を含む数十の面接を設定しました。上海交通大学や人民大学などの大学にも出願しました。私の日課は、日中は学校へ行き、午後4時頃にバスでアパートに戻り、面接を受け、その後夕食を作るというものでした。シアトルの冬は雨が多く、夜は雨が降ることも少なくありませんでした。平均して1日に2回の面接があり、用意した原稿をリハーサルしていたことが、当時の最も鮮明な記憶です。 幸運にも、厳しい面接はすぐに報われました。ファーウェイのグローバルサービス部門から「Genius Youth A」のポジションのオファーを受けました。これは当時、私にとって最高の条件でした。しかし、少し迷った後、コンピューティング研究部門からのオファーを推し進めるために辞退しました。ところが、オファーを辞退した時、ヘッドハンターの一言が私の心に憤りの種を植え付けました。コンピューティング研究部門は別の候補者を待っており、私のオファーを進めていないと言われたのです。その後、何度も確認しましたが、その度に否定的な返答をもらいましたが、それでも私は納得していませんでした。 ファーウェイのグローバルサービス部門からのオファーに続き、他の企業もすぐに追随しました。テンセントからのトップ幹部候補のオファーはすぐに届き、2012リサーチセンター、ハイシリコン、端末部門からのオファーもすぐにCEO面接の段階に進みました。この情報がコンピューティングリサーチ部門に伝えられ、ようやく進展があり、オファーが届きました。私も「天才青年A」賞を授与されました。12月末にオファーに署名し、ファーウェイへの移籍がほぼ確定しました。1月に中国に戻り、三者間合意書を急いでファーウェイに郵送し、すべてが解決したように見えました。他のオファーについては、テンセントにはきっぱり断り、ハイシリコンの廖波氏とはうまくいかなかったのでグループチャットを退会しました。2012リサーチセンターからは「天才青年A」賞を授与されました。百度の人事部から他のオファーについていくのは無理だと言われたので諦めました。アリババからのオファーは7、8回の面接の後、結局は不採用となりました。バイトダンスは高水準だが低賃金のポジションを提示してきたが、競争力は低かった。上海交通大学からはフィードバックがなく、人民大学からは講師のポジションを提示された。中国への帰国が近づいていたので、春節が過ぎたら全て断るつもりだった。 春節の時期に、ByteDanceから突然連絡があり、さらに2つの選択肢を提示されました。1つは北米で直接入社すること、もう1つは中国でより高い給与を提示されることでした。中国での給与は、私がこれまでに提示したすべてのオファーを上回り、突如最も競争力のあるオファーとなりました。一方、Deepseekも引き続き競争力のあるオファーを出していました。そこで、ジレンマに陥りました。Huawei、ByteDance、それともDeepseek?どれを選ぶべきでしょうか? この3社の間のジレンマは、長い間私を悩ませてきました。周りの先輩やメンター、そして他の先輩たちなど、同じ経験をしてきた人たちに相談してみましたが、皆がそれぞれの意見を述べてくれましたが、全員一致でHuaweiを挙げていました。ByteDanceについては、アメリカに行くとTikTokは大きなリスクになる、中国に残ればアメリカの上司との距離が遠く昇進の妨げになる、国境を越えたコミュニケーションは対面でのやり取りに勝るものはない、といった意見でした。DeepSeekについては、皆聞いたことがないと言いました。周りの人から良いアドバイスがなかったので、まずはDeepSeekから始めて、3社すべてを実際に体験し、その後Huaweiでインターンシップをすることにしました。ByteDanceでインターンシップをしたことがあるから、ある程度の知識はあったので、今回は省略します。 2024年4月、DeepseekのCEOである梁氏とのビデオチャットの後、インターンシップのオファーを受けました。当時、Deepseekはまだインターネット金融センターにあり、オフィスは1つだけでした。アルゴリズム、人事、エンジニアリングのスタッフが同じ部屋にいました。オフィスには軽食コーナーと休憩コーナーがありました。昼食は外注のケータリングサービスで会社まで届けられ、夕食は80元の配達手当が支給されました。アフタヌーンティーには、チームメンバーが自らカットしたような、かなり豪華なフルーツが添えられていました。毎月の誕生日パーティーや小さなパーティーもありました。仕事の面では、私に割り当てられた仕事はあまりなく、基本的には卒業論文を書いたり、論文を読んだり、Hopper gemmの書き方を勉強したりしていました。Hopper gemmに関する以前の記事もこの時期に書いたものです。全体的に静かで平和な雰囲気でした。私は超自己中心的な性格で、あまり社交的ではありません。周りの同僚ともあまり会話をしませんでした。彼らは北京大学の中国語学科出身で、強化学習データに取り組んでいるような感じでした(だからこそ、Deepseekのモデルライティングは今かなり優れていると思います)。その頃、私は杭州に出張し、インフラ整備に携わる同級生に会っていました。今振り返ると、Deepseekで過ごした1ヶ月は実はとても自由でした。しかし、当時体調が優れなかったことと、その後すぐにHuaweiに入社することになっていたため、早期退職しました。 次にファーウェイへの入社手続きが始まりました。しかし、ファーウェイは短期インターンシップを提供しておらず、すぐに入社するのが最善だと考えていました。また、入社を後押しする外的要因もあったため、私は同意しました。2024年5月に正式にファーウェイに入社しましたが、初日は非常に大変でした。ファーウェイの北京研究所は遠すぎ、北清路はひどく渋滞しており、タクシーに乗るのは毎日の苦痛でした。当初は仕事はほとんどなく、主に書類を読んだり、様々な試験を受けたり、オンラインコースを受講したりと、非常に退屈な日々でした。チームは強い職人階級の雰囲気で、会社は全員に時間通りの出勤を義務付けており、皆がそれに従っていました。食事中の会話は仕事や通勤といったありふれた日常の話ばかりで、あまり面白くありませんでした。オフィスシステムは高度にカスタマイズされており、機密保持規定は非常に煩雑で詳細でした。また、杭州にも出張し、杭州研究所のリーダーたちと食事をしました。ファーウェイには、強いビジネス文化と厳格な階層構造があると感じていました。リーダーたちは私を「田紹(ティエン・シャオ)」と紹介し、皆の役職もすぐに分かりやすく教えてくれました。常に階層に応じて話すという意識がありました。ファーウェイには多くの同級生や知り合いがいたので、いつも居心地が良かったです。同僚たちもとても親切で、高い感情知能を持ち、一緒にいてとても居心地が良かったです。仲間意識があり、皆が博士号取得者をとても尊敬していました。全体的にはファーウェイは良い会社でしたが、私にとって理想的な環境ではないと感じました。まず、厳格で複雑な規則や規制、特に厳格な出退勤記録と口封じの守秘義務が気に入りませんでした。次に、技術革新は保守的でペースが遅く、パイオニア精神が欠けていました。最後に、論文発表をあまり重視していないように思えました(彼らは論文を読むことには熱心でしたが)。私は論文発表を続けたいと思っていました。そのため、1ヶ月後、私はファーウェイを辞めることにしました。 ファーウェイを退職後、DeepSeekとByteDanceのどちらかを選ばなければなりませんでした。当初はDeepSeekに傾き、梁氏と2度目のビデオ会議も行いました。しかし、梁氏が引き受けたい業務をこなすのは私には無理だと感じました。チップの設計と製造には莫大な資金と人的資源が必要であり、DeepSeekでは対応できないと考えました。さらに、ファーウェイを退職すると雇用契約と社会保障制度の変更が必要になり、新卒者向けの北京居住権を取得する機会を失うことになります。この問題はDeepSeekでは解決できず、ByteDanceだけが報酬プランを提供していました。また、DeepSeekがByteDanceよりも大幅に高い給与を提示してくれることを期待していましたが、梁氏が承認した昇給額はわずかに高い程度でした。そのため、最終的にByteDanceを選びました。 ByteDanceに入社後、いくつか残念な点もありました。まず、ByteDanceは人員が多すぎました。Deepseekは人員が少なく、ワークステーションも広く、間隔も広く、非常に働きやすかったです。一方、Huaweiは人員は多かったものの、作業エリアも広く、ワークステーションも非常にゆったりとしており、快適な職場環境でした。ByteDanceのワークステーションは、まるでインターネットカフェのようにぎゅうぎゅう詰めで、非常に居心地が悪かったです。もう一つの問題は、なかなか馴染めないことでした。顔見知りはほとんどおらず、知り合い同士でも警戒感がありました。ほとんどの社員は修士号を取得しており、博士号取得者に対して良い印象はありませんでした。Huaweiのような親しみやすさも、Deepseekのような優秀な人材同士の相互尊重もありませんでした。さらに、福利厚生は充実しているように見えましたが、質は全体的に低いものでした。無料の食事も1食25元程度だったので、それほど特別なものではなかったことは想像に難くありません。アフタヌーンティーもDeepseekに比べるとはるかに劣っていました。しかし、これらの福利厚生は今年で終了しました。こうした細かい点を除けば、他の点は非常に良好です。ある程度の自由度があり、学術活動への参加、論文発表、学会への出張(Deepseekでは不可能)、ポスドクのポジション獲得など、自分の希望を話し合い、サポートしてもらえます。また、ByteDanceは規模も大きく、様々な分野で強力なリソースを有しています。さらに、ByteDanceは高い技術力を有しており、その水準はトップクラスだと考えています。 最終的にはDeepSeekには入社しませんでしたが、そこで出会った同僚とは今でも親しくしています。DeepSeekの最近の人気の急上昇は、全く驚きではありません。実は、私たちが今見ているのは、半年前の彼らの努力の成果なのです。世間の認識は一般的に遅れており、群集心理が働いています。だからこそ、ようやくDeepSeekが受け入れられ始めたのです。しかし、ByteDanceで働く者として、私はある疑問を抱いています。ByteDanceはDeepSeekよりも明らかに優れた人材、ハードウェア、データリソースを持っているのに、なぜAI分野で大ヒット商品を生み出しておらず、比較的停滞しているのでしょうか?ByteDanceにも、どうすればリードを奪うチャンスがあるのでしょうか? 私個人の意見ですが、大企業の問題点は、確信と自信の欠如、そして人材の多様性過剰にあります。まず、確信について。梁社長自身は強い確信を持っており、AGI(無人搬送車)は必ず実現し、限られた期間内に実現すると信じています。そして、このAGIは希少価値の高いものになると考えています。この確信は部下全員に浸透しています。一方、ByteDanceの経営陣はAGIへの確信が欠けており、明確な判断力に欠け、この確信を部下に伝えることができません(伝えるには人数が多すぎるからです)。次に、自信について。ByteDanceは主にOKRを実践しており、ビジネスが最優先です。ビジネスに明確なメリットがなければ、人々は自信を失い、深く掘り下げようとしません。つまり、ByteDanceでは、具体的な成果が出ないまま何かを探求するというプレッシャーに耐えるのは難しいのです。バイトダンスに一緒に入社した同僚たちは、非常に几帳面で用心深く、ひたすらビジネスに尽くし、決して既成の境界を逸脱しようとはしません。第三に、多様な人材を抱える職場環境は、団結力を維持することを困難にしています。しばしば、同僚は他人の仕事を気にかけず、ひそかに仕事を妨害する者さえいます。ディープシークでは、チーム内に不思議な一体感が生まれています。誰もが上司のファンであり、その言葉を信じ、会話は競合他社に対する強みや改善点に集中します。全体的な雰囲気は非常に協力的で、前向きで協力的な環境が育まれています。一方、バイトダンスでは、激しい競争の後に強制的に統合されるという、チーム合併のプロセスを目の当たりにしました。その結果、社内抗争、人材、時間、揺るぎないコミットメント、そしてリソースの無駄が生じ、最終的には双方にとってメリットのない状況に陥り、競争優位性を失う可能性を招いていました。かつて、Topseedの全チームを単一のリーダーの下に集結させ、AGIを探求すればDeepseekの環境を再現できるのではないかと考えていましたが、それは単なる思いつきに過ぎません。ByteDanceのインフラは、アルゴリズム、インフラ、コンピューティング能力など、DeepseekやHuaweiよりも包括的です。この優位性を活かして競争優位を獲得できるかどうかは、ByteDanceの今後の戦略と経営陣の行動にかかっています。これは、私という端くれが影響を与えることはできません。 ただし、上記のアイデアはすべてAGIの観点からのものです。私自身はアルゴリズムの開発には携わっておらず、コンパイラとしてのみ活動しています。個人的な観点から言えば、ByteDanceの利点は、ある程度の独立性を持つインフラストラクチャについて、独立して優れた研究ができることです。これは、科学研究を行いたい私のような人間にとって、より親しみやすいものです(対照的に、Deepseekのインフラストラクチャは明らかに密結合アルゴリズムであり、独立性は弱いです。結局のところ、彼らの論文を見ると、インフラストラクチャはせいぜい第二著者であり、インフラストラクチャだけで論文を発表することは困難です)。 過去 1 年間の経験を要約すると、次のようになります。 1.自分で分析して選択しましょう。常に他人の意見に頼ってはいけません。私が就職活動を始めた頃は、とても迷っていて、いつも他の人にどちらが良いか教えてもらいたかったのです。しかし、ほとんどの場合、他の人は完全で信頼できる情報を持っておらず、適切なアドバイスをしてくれませんでした。例えば、Deepseekが良い選択肢だと分かっていたら、それを選べたはずです。知識のない人にアドバイスを求める必要はありませんでした。
3. 好きなことを諦めずに追求し、妥協せず、集中力を保ちましょう。OKRやパフォーマンスのプレッシャーに耐えられるようになりましょう。堂々巡りをして楽をしようとしないこと。多くのことに気を取られず、一つのことに集中しましょう。私は昨年これを実践せず、振り返ってみると、喜ぶべき成果はありませんでした。たとえパフォーマンスが低下したとしても、今後も諦めずに努力を続けなければなりません。 4. どこで仕事をするかは重要ではありませんが、実はとても重要です。自分のものではない他人の幸せを追い求めて、すでに持っている幸せを簡単に手放してはいけません。どの家族にもそれぞれの良さがあるのです。 いいね! (3件のいいね!)↓ |
大規模モデルに基づく私の DeepSeek インターンシップ体験とキャリアの考察!
関連するおすすめ記事
-
雷軍は95年代以降のAIの天才少女を引き抜き、数百万ドルの年俸を提示した!
-
退学寸前だったハーバード大学の学生が、起業を目指して自主的に学業を休学することを選んだ | ビル・ゲイツの自伝、*ソースコード*
-
WeChat 友達の中に「秘密の AI」を発見したことがない人はいませんか。赤い封筒のカバーを作るだけだと思っていましたか?
-
OpenCity の大規模交通予測モデルは、香港大学と Baidu の協力により、ゼロショット シナリオで非常に優れたパフォーマンスを発揮します。
-
COSCon'24 オープンソースマーケットプレイスが正式にオープンしました!ぜひマーケットブースにお越しいただき、楽しいひとときをお過ごしください!
-
Alibaba Cloud Tongyi は、最初の推論ステップ評価標準をオープンソース化し、AI 推論モデルの新たな道を模索しています。