中国の大規模言語モデル企業であるDeepSeekが、初の外部資金調達に向けて投資家と協議を進めていることが分かった。報道によると、同社は100億ドル以上の企業価値評価で、少なくとも3億ドルの資金調達を目指しているという。実現すれば、設立以来初の外部株式による資金調達となる。これまで同社は、量的運用会社である幻方量化(High-Flyer Quant)の支援を背景に、中国の主要ベンチャーキャピタルやIT大手からの出資提案を複数回にわたり見送ってきた経緯がある。
今回の資金調達の動きについて、業界関係者は人材流出と次世代モデル開発の負担が背景にある可能性を指摘する。2025年下半期以降、同社では少なくとも5人の中核的な研究開発人材が流出したとされ、基盤モデル、推論、文字認識(OCR)、マルチモーダルといった重要分野に及んでいる。
具体的には、マルチモーダルモデルの主要開発者である阮翀が自動運転企業の元戎启行(DeepRoute.ai)に移りチーフサイエンティストに就任したほか、第1世代大規模言語モデルの主要開発者である王炳宣はTencentに参加した。また、R1の中核研究者である郭達雅はByteDance(ByteDance Ltd.)のSeedチームに加わり、V3の主要貢献者である羅福莉はXiaomiのMiMoチームに参画した。郭達雅は、推論能力の学習手法の中核とされるGRPOアルゴリズムの主要開発者の一人とされる。
関係者によれば、DeepSeekの給与水準は業界内では中程度とされる一方、ヘッドハンターが2〜3倍の報酬やストックオプションを提示して人材の引き抜きを進めているという。
技術面では、同社は4月8日に公開した最新版で「高速モード」と「専門家モード」を新たに導入し、公式サイト上で初めて機能の階層化を行った。さらに、4月中にも次世代モデル「V4」の正式リリースが見込まれている。V4は大規模専門家混合(MoE)アーキテクチャを採用し、パラメータ規模は最大で1.6兆に達する可能性があるとされる。
一方で、こうした中核人材の流出が、V4の開発や公開スケジュールに影響を及ぼす可能性も指摘されている。
(中国経済新聞)
