Anonymous Intelligence Signal
DeepSeek两日两降:V4-Flash缓存输入跌至0.02元/百万tokens,中间层厂商承压
DeepSeek在48小时内完成两次调价,将全系API输入缓存命中价格直接砍至首发价的十分之一。4月25日,V4-Pro限时优惠将缓存命中价格压至0.25元/百万tokens;次日,叠加限时折扣后,V4-Pro缓存输入降至0.025元、V4-Flash降至0.02元,刷新全球大模型价格纪录。以村上春树《挪威的森林》全文约20万字计算,完整缓存命中后调用的成本不足一分钱。这不只是数字的巧合——DeepSeek研究员陈德里已在社交媒体确认,缓存命中降价为永久性定价,并附上"AGI for Everyone"标签,释放出将价格战从营销噱头固化为长期战略的信号。
更值得关注的是DeepSeek此次降价的精准指向性。长文本处理、长代码生成、大规模知识库检索——这些原本推理成本最高的场景,被一并纳入价格谷底。DeepSeek采用"先限时折扣试探市场负载、再永久降价锁定高频场景"的分步策略,针对RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用场景,理论上可实现90%以上的成本压缩。这意味着,中间层AI公司的核心商业模式正面临直接挤压。
大厂对此轮降价反应淡然,根本原因在于其商业逻辑不同:API只是引流入口,真正利润来自背后的计算、存储、数据库等云服务。以阿里云为例,4月15日刚宣布算力卡涨价5%-34%、存储涨价30%,同时仍愿意代理DeepSeek——客户即便调用DeepSeek模型,仍无法脱离阿里云的算力底座。相比之下,智谱AI在四个月内已连续三次涨价,累计涨幅达83%,其CEO张鹏的解释是"瓶颈在算力,不在客户"。DeepSeek的激进定价,正在加速中国AI产业链的价值重分配:底层算力供应商地位稳固,中间应用层则面临生死淘汰赛。