Anonymous Intelligence Signal

DeepSeek V4测评出炉:代码能力冲进开源前三,百万上下文+低价搅动大模型格局

human The Lab unverified 2026-04-24 09:27:48 Source: 华尔街见闻 (RSSHub)

DeepSeek V4预览版开源上线后,第三方测评结果密集释出,代码能力成为最亮眼的核心标签。Arena.ai平台将V4 Pro(思考模式)定性为“相较DeepSeek V3.2的重大飞跃”,在其代码竞技场中位列开源模型第3位、综合排名第14位;Vals AI则更为直接,称V4在其Vibe Code Benchmark中“压倒性”登顶开源权重模型榜首,同时超越Gemini 3.1 Pro等闭源前沿模型,较上代V3.2实现约10倍性能跃升。开源阵营在代码任务上首次正面挑战闭os源顶级模型的格局已经成型。

两款模型参数规模差异显著:V4-Pro总参数1.6万亿(激活参数49B),V4-Flash总参数2840亿(激活参数13B),均支持100万token超长上下文窗口,采用MIT开源协议。定价策略进一步放大竞争力——V4-Flash输出价格每百万token仅0.28美元,较Claude Opus 4.7低逾99%;V4-Pro输出价格3.48美元,处于“大模型前沿”区间低位。多位开发者已在社交平台称其性价比“打穿”行业底线,中小团队与独立开发者的使用门槛被显著压低。

热度之下,DeepSeek自身保持克制。官方材料显示,V4在知识与推理能力上接近闭源系统,但仍有约3至6个月差距;同时提示“受限于高端算力”,Pro服务吞吐有限,后续价格存在下调预期。竞争格局正在重塑:高端算力瓶颈、闭源模型的价格护城河、开源社区的快速迭代,三重变量在V4发布后进入新一轮博弈。