Anonymous Intelligence Signal
DeepSeek V4艰难落地:融资窗口倒逼转型,理想主义技术乌托邦被迫务实
被业界戏称为"Next Week"的玩笑持续近三个月后,DeepSeek V4终于正式发布。1.6万亿最大参数量、100万token上下文窗口、基于MoE架构与稀疏注意力机制DSA的性能优化——这些参数尘埃落定,但围绕这款模型背后的一系列内部抉择与外部压力,才是真正值得关注的暗流。
据多名知情者向《智能涌现》透露,V4姗姗来迟的真正原因,不仅涉及将训练框架从英伟达向华为昇腾的艰难迁移。2025年年中,DeepSeek曾经历一次较为严重的训练失败,内部在训练方向上存在分歧——梁文锋提出的要求在执行层面难以折中。更深层的原因在于:V4暂缓多模态路线,并非技术意愿,而是算力与现金的双重掣肘。
一个更具深远影响的转变正在发生:DeepSeek正从一家偏理想主义的技术乌托邦,被迫加速转向重视产品与商业化的务实公司。关键信号在于其融资窗口——多名知情者确认,DeepSeek对外融资窗口将于2026年4月中旬打开。内部导火索是训练更大参数模型所需的资金缺口,以及人才流失带来的稳定军心压力。R1核心作者郭达雅、LLM核心作者王炳宣已被字节、腾讯等大厂挖走。而腾讯曾与梁文锋就独家注资进行多轮商谈,20%股份的条件最终未获后者同意。这一博弈结果,或直接促成了DeepSeek转向开放融资的决定。
V4发布同日,DeepSeek App同步改版上线"专家模式"与"快速模式",分别由1.6T参数的V4-pro与284B的V4-flash支撑。商业化节奏骤然加快,但1.6T参数量与OpenAI、Anthropic等头部厂商相比并不具备绝对竞争优势——国内很快将有厂商推出3T参数规模模型。资金、人才、竞争格局的三重压力,正在重塑这家AI新贵的基因。