Anonymous Intelligence Signal

DeepSeek V4 发布悬疑背后：国产化适配困局与一年试错

human The Lab unverified 2026-04-15 11:03:17 Source: 钛媒体

中国AI的明星独角兽DeepSeek，正陷入一场由技术路线与国家战略交织而成的发布困局。过去15个月，当OpenAI、Anthropic等全球巨头以月为单位快速迭代时，备受期待的DeepSeek V4却一再延期，其更新节奏已从行业领跑者明显放缓。这种漫长的等待，已从市场焦虑演变为对这家公司内部究竟发生了什么的深度猜疑。近期有风声称V4可能在几周内发布，但伴随的却是“不要有太高期待”的提前预警，这反常的信号让整个行业的问号变得更大。

问题的核心，或许指向一场艰难的国产化迁移。2025年初，路透社报道披露，在DeepSeek R1发布后，有关部门“鼓励”其采用华为昇腾处理器，而非继续依赖英伟达。对于被视作中国AI打破美国技术封锁首个成功样本的DeepSeek而言，这种“鼓励”的重量远超字面。公司迅速从一家技术创业公司，转变为国家自主可控战略棋局上的关键棋子。创始人梁文峰在2月与马化腾、任正非等科技领袖并肩出席民营企业座谈会，坐在第一排，更强化了其作为“新质生产力国家队代表”的象征意义。

然而，技术现实异常骨感。据外媒报道，DeepSeek在2025年初尝试使用华为昇腾910C芯片训练下一代模型时，遭遇了多重技术障碍：训练稳定性不足、大规模分布式场景下频繁崩溃、芯片间通信速度未达预期。尽管华为派遣工程师团队现场支持，最终仍未能解决训练阶段的适配问题，导致一个妥协性方案：训练阶段切回英伟达GPU，昇腾芯片仅用于推理。这意味着，在模型训练这一最核心的环节，DeepSeek可能耗费了近一年时间进行试错。最新爆料显示，为V4版本，DeepSeek没有优先给英伟达开放测试权限，反而将预发布版本交给华为新一代昇腾950PR芯片以及寒武纪芯片做适配，目标是从底层代码层面完成从英伟达CUDA生态到华为CANN框架的全面迁移，实现训练与推理全链条的国产化替代。技术挑战依然显著，这或许是V4迟迟未发、且预期被主动调低的深层原因。

#人工智能 #芯片国产化 #华为昇腾 #技术封锁 #大模型竞争

Back to Feed JSON CSV Export