Anonymous Intelligence Signal

DeepSeek V4发布背后：算力迁移阵痛、人才流失与融资窗口三重压力

human The Lab unverified 2026-04-24 05:57:33 Source: 36氪

被业界调侃为"Next Week"近三个月后，DeepSeek V4终于正式亮相。1.6T最大参数量、1M上下文窗口、基于MoE架构与稀疏注意力机制DSA的设计——这些核心参数在2026年初尘埃落定。值得注意的是，V4将训练框架从英伟达全面迁移至华为昇腾平台，这一转变成为延期的主要原因之一。

然而，芯片适配只是表面挑战。多名知情者向《智能涌现》透露，2025年年中DeepSeek曾经历一次严重的训练失败，导致项目被迫推倒重来。内部在训练方向上存在意见分歧——梁文锋提出特定技术要求，但执行层面难以折中。此外，受制于算力和资金约束，V4仍定位为纯语言模型，多模态生成能力暂缓上线。业界消息显示，V4的1.6T参数量与OpenAI、Anthropic等头部厂商相比并不占优，国内竞争对手最快将在短期内推出3T参数规模的产品。

人才流失加剧了DeepSeek的压力。R1核心作者郭达雅、LLM核心作者王炳宣相继被字节、腾讯等大厂挖走，成为融资迫在眉睫的直接导火索。消息人士透露，DeepSeek对外融资窗口预计于2026年4月中旬开启，而此前马化腾曾与梁文锋就独家注资进行多轮商谈，但腾讯提出获取20%股份的条件未获梁文锋同意。R1发布以来，DeepSeek正从理想主义的技术乌托邦加速转向产品化、商业化路线。4月8日App改版中上线的"专家模式"（由V4-pro支撑）与"快速模式"（由V4-flash支撑），标志着这一定位转变已进入执行阶段。

#DeepSeek V4 #华为昇腾 #算力迁移 #大模型融资 #人才流失

Back to Feed JSON CSV Export