DeepSeek-V4强势入场:万亿参数首嫁国产算力,价格战背后暗藏隐忧
DeepSeek-V4上线仅数日,围绕其技术突破与市场策略的讨论持续发酵。与外界此前对DeepSeek迭代放缓的质疑形成鲜明对比,梁文锋用V4的强势发布给出了回应。V4-Pro版本参数规模达到1.6T,较V3扩大两倍,跻身开源模型最高梯队,直接向OpenAI和谷歌看齐,同时保留1M超长上下文能力。这一参数规模的跃升,标志着DeepSeek正式告别"小而美"路线,转向"参数暴力美学"与稀疏架构效率并行的策略。
更具行业标志性意义的是国产算力适配的突破。DeepSeek技术报告首次将华为昇腾与英伟达并列写入,将细粒度专家并行方案在双平台上均完成验证。V4在昇腾平台上实现1.50至1.73倍推理加速,成为全球首个在国产算力底座上完成训练与推理验证的万亿参数级模型。千芯科技董事长陈巍将适配工作量形容为"爬雪山、过草地",直言DeepSeek为此承受巨大工程压力,也使其难以全力投入模型性能优化。但这一突破迅速传导至资本市场:4月24日,寒武纪、摩尔线程、沐曦等国产芯片企业股价集体上涨2%至7%,并同步宣布全量适配V4。
与此同时,DeepSeek的价格攻势亦未停歇。V4-Pro API限时2.5折优惠,输入最低至0.025元、输出6元,较原价大幅下调。DeepSeek方面解释,当前受高端算力限制吞吐有限,预计下半年昇腾950超节点批量上市后价格将进一步走低。然而,《中国企业家》观察到,V4上线首两日,API服务与网页对话均保持稳定,未出现拥堵现象,用户反馈相对"冷静"——在大模型厂商普遍掀起"Token涨价潮"的背景下,DeepSeek逆势而行,究竟是算力充裕带来的主动定价权,还是用户热情不足的被动选择,仍待观察。核心人才被竞争对手争抢、国产适配工程负重前行,V4的发布固然是一场胜利,但也让外界开始正视这家明星创业公司正在承受的多重压力。