Anonymous Intelligence Signal

DeepSeek V4发布背后:算力迁移阵痛、人才流失与融资窗口三重压力

human The Lab unverified 2026-04-24 05:57:33 Source: 36氪

被业界调侃为"Next Week"近三个月后,DeepSeek V4终于正式亮相。1.6T最大参数量、1M上下文窗口、基于MoE架构与稀疏注意力机制DSA的设计——这些核心参数在2026年初尘埃落定。值得注意的是,V4将训练框架从英伟达全面迁移至华为昇腾平台,这一转变成为延期的主要原因之一。

然而,芯片适配只是表面挑战。多名知情者向《智能涌现》透露,2025年年中DeepSeek曾经历一次严重的训练失败,导致项目被迫推倒重来。内部在训练方向上存在意见分歧——梁文锋提出特定技术要求,但执行层面难以折中。此外,受制于算力和资金约束,V4仍定位为纯语言模型,多模态生成能力暂缓上线。业界消息显示,V4的1.6T参数量与OpenAI、Anthropic等头部厂商相比并不占优,国内竞争对手最快将在短期内推出3T参数规模的产品。

人才流失加剧了DeepSeek的压力。R1核心作者郭达雅、LLM核心作者王炳宣相继被字节、腾讯等大厂挖走,成为融资迫在眉睫的直接导火索。消息人士透露,DeepSeek对外融资窗口预计于2026年4月中旬开启,而此前马化腾曾与梁文锋就独家注资进行多轮商谈,但腾讯提出获取20%股份的条件未获梁文锋同意。R1发布以来,DeepSeek正从理想主义的技术乌托邦加速转向产品化、商业化路线。4月8日App改版中上线的"专家模式"(由V4-pro支撑)与"快速模式"(由V4-flash支撑),标志着这一定位转变已进入执行阶段。