DeepSeek V4 发布悬疑背后:国产化适配困局与一年试错
中国AI的明星独角兽DeepSeek,正陷入一场由技术路线与国家战略交织而成的发布困局。过去15个月,当OpenAI、Anthropic等全球巨头以月为单位快速迭代时,备受期待的DeepSeek V4却一再延期,其更新节奏已从行业领跑者明显放缓。这种漫长的等待,已从市场焦虑演变为对这家公司内部究竟发生了什么的深度猜疑。近期有风声称V4可能在几周内发布,但伴随的却是“不要有太高期待”的提前预警,这反常的信号让整个行业的问号变得更大。
问题的核心,或许指向一场艰难的国产化迁移。2025年初,路透社报道披露,在DeepSeek R1发布后,有关部门“鼓励”其采用华为昇腾处理器,而非继续依赖英伟达。对于被视作中国AI打破美国技术封锁首个成功样本的DeepSeek而言,这种“鼓励”的重量远超字面。公司迅速从一家技术创业公司,转变为国家自主可控战略棋局上的关键棋子。创始人梁文峰在2月与马化腾、任正非等科技领袖并肩出席民营企业座谈会,坐在第一排,更强化了其作为“新质生产力国家队代表”的象征意义。
然而,技术现实异常骨感。据外媒报道,DeepSeek在2025年初尝试使用华为昇腾910C芯片训练下一代模型时,遭遇了多重技术障碍:训练稳定性不足、大规模分布式场景下频繁崩溃、芯片间通信速度未达预期。尽管华为派遣工程师团队现场支持,最终仍未能解决训练阶段的适配问题,导致一个妥协性方案:训练阶段切回英伟达GPU,昇腾芯片仅用于推理。这意味着,在模型训练这一最核心的环节,DeepSeek可能耗费了近一年时间进行试错。最新爆料显示,为V4版本,DeepSeek没有优先给英伟达开放测试权限,反而将预发布版本交给华为新一代昇腾950PR芯片以及寒武纪芯片做适配,目标是从底层代码层面完成从英伟达CUDA生态到华为CANN框架的全面迁移,实现训练与推理全链条的国产化替代。技术挑战依然显著,这或许是V4迟迟未发、且预期被主动调低的深层原因。