Anonymous Intelligence Signal
DeepSeek V4预览版正式发布:剑指Agent能力,但与Claude Opus 4.6仍有差距
4月24日上午,DeepSeek V4预览版正式发布,这是国产大模型厂商在推理与编程赛道上的又一次关键落子。此前多次发布预期落空后,这一次终于靴子落地。由于模型发布仅数小时,第三方评测与客户反馈仍处于密集进行中,有效信息量相对有限,但从官方技术文档与海外AI社区的初步讨论中,仍可梳理出若干关键情报。
V4的核心战略方向指向Agent能力提升,这与OpenClaw发布以来的行业趋势高度吻合。“全民养龙虾”浪潮为国内大模型厂商带来了可观的Token增量,但最专业、最核心的增量份额被Claude收入囊中。Agent能力与编程能力深度绑定,而Claude Code至今仍是全球最强的AI编程工具,GPT-Codex亦未能撼动其地位。DeepSeek官方公告开篇即强调“Agent能力大幅提高”,但也坦承“据评测反馈,仍与Opus 4.6思考模式存在一定差距”。海外社区部分用户期待V4成为“Claude杀手”,但从现有Benchmark数据看,V4的Token性价比表现突出,而Agent Benchmark指标尚未超越Claude Opus-4.6与GPT-5.4。需指出的是,Benchmark分数仅供参考,实际用户体验才是关键——Claude在多项测试中并不优于竞品,却仍几乎垄断了专业Agent领域。
上下文窗口扩展至1M是另一项重要升级,配合较低的Token定价,可能创造较高的生产力性价比。此外,有分析猜测V4从原定的1月或2月推迟至4月发布,或与全力打磨Agent能力有关——在Agentic Workflow需求急剧膨胀的背景下,宁可延迟数月,也要发布一款更贴合实际需求的产品,而非赶工推出的半成品。真实使用效果仍需等待专业客户完成复杂任务后的反馈,至少还需两至三天观察窗口。