The Lab · 2026-04-01 10:30:18 · 36氪最新 (RSSHub)
2025年初,当 Anthropic 宣布其 Claude API 价格比 GPT-4 高出 50% 时,市场普遍预期将迎来客户流失潮。然而,六个月后的数据给出了一个截然相反的答案:Claude 在企业市场的采用率不降反升。更关键的是,到 2025 年底,据 Menlo Ventures 报告,Anthropic 在企业级 AI 市场的占有率已达 40%,首次超越 OpenAI 的 27%,成为 B 端市场的新领导者。这一现象彻底颠覆了互联网时代“基础服务应廉价甚至免费”的惯性认知,揭示出 AI 软件价值评估体系正在发生根本性偏移。
用户付费的对象,正从底层的 Token 消耗或最终的业务结果,转向一种介于两者之间的、难以被传统指...
The Lab · 2026-04-07 01:59:23 · 36氪最新 (RSSHub)
在Anthropic封禁第三方工具“龙虾”等接入后,小米大模型团队负责人罗福莉凌晨发文,直指行业乱象。她批评“龙虾”等工具的上下文管理“很拉胯”,一个用户请求会触发多轮携带长上下文的独立API调用,严重浪费token资源。罗福莉认为,虽然Anthropic此举短期内会推高用户成本,但长期将迫使开发者进行更合理的工程优化,提升token使用效率,这被其称为“很好的工程纪律”。
罗福莉的核心观点是呼吁模型厂商不要陷入“价格战”和“token倾销”。她点名批评部分厂商以极低价格吸引用户入坑,随后却用缩水的模型能力和不稳定的服务损害体验。这间接回应了外界对小米自家“MiMo Token Plan”套餐定价偏贵的质疑。罗福莉强调,小米的目标...
The Lab · 2026-04-08 03:29:43 · 澎湃新闻 (RSSHub)
智谱AI在宣布正式开源其旗舰模型GLM-5.1的同时,再度上调了API价格10%,这一组合拳直接引爆了市场情绪,推动其港股(02513.HK)盘中一度暴涨近19%。此次调价后,GLM-5.1在编程(Coding)场景的缓存命中Token价格已接近海外头部厂商Anthropic旗下Claude Sonnet4.6的水平。这标志着国产大模型首次在核心应用场景实现了与海外顶尖产品的价格对齐,被视为一次重要的市场地位宣示。
GLM-5.1被智谱定位为“迄今最智能的旗舰模型”和“目前全球最强的开源模型”。在关键的编程能力上,该模型在SWE-bench Pro、Terminal-Bench、NL2Repo三大代码评测基准的综合平均分中,取得了...
The Lab · 2026-04-15 03:33:47 · 华尔街见闻 (RSSHub)
Anthropic已悄然调整其企业级AI产品Claude Enterprise的定价模式,从固定订阅费转向“基础费+按量计费”。这一未公开披露的变更,意味着重度依赖AI算力的企业客户可能面临账单大幅攀升的风险,部分用户的月度成本或增至原先的三倍。新模式在每用户每月20美元的基础费之上,额外根据实际消耗的算力收费,取代了此前最高200美元/用户的固定订阅套餐。Anthropic发言人已确认此调整,并称其“更好地反映了客户的实际使用方式”。
此次定价重构的核心驱动力是算力成本压力。旧模式下,企业客户支付固定费用以换取一定额度的“折扣Token用量”,类似于流量包。然而,随着Claude Code(代码生成工具)和Claude Cowo...
The Lab · 2026-04-16 01:33:32 · 华尔街见闻 (RSSHub)
黄仁勋在GTC 2026上描绘的Token驱动的新工业时代,正面临一个核心矛盾:表面上,Token已成为AI时代最标准、最可量化的经济单位,各大模型厂商的定价页也呈现出近乎工业标准的整齐划一。然而,这种格式上的高度趋同,掩盖了AI行业远未进入规则成熟、产品标准化竞争阶段的现实。事实恰恰相反,Token的价格是透明的,但Token价格背后的“价值”是一个巨大的黑盒。对于企业技术负责人而言,单纯比对OpenAI GPT-5.4与Anthropic Claude Opus 4.6的标价(如每百万Token输入2.5美元 vs. 5美元)毫无意义,因为上下文窗口策略、工具调用计费逻辑以及缓存折扣深度上的巨大差异,足以抹平甚至倒置标价上的倍数...
The Lab · 2026-04-20 04:33:05 · 36氪最新 (RSSHub)
当OpenAI的ChatGPT引爆全球AI热潮,各大厂商纷纷涌入,一场围绕“Token经济”的成本暗战已然打响。然而,试图通过简单的“Token单价×调用次数”来计算AI应用的真实成本,已成为一个不可能完成的任务。开发者社区中流传的成本对比表,在厂商复杂的定价体系面前迅速失效。一个核心问题浮出水面:主流AI平台售卖的根本不是同一种标准化的“商品”。
翻开OpenAI、Google Gemini和Anthropic的价格页面,混乱的计费维度令人眼花缭乱。OpenAI的价格表如同一张资源总账:除了Token,联网搜索按千次调用收费,容器按会话时长收费,文件检索存储按GB/天收费,还要叠加10%的区域处理费。Google Gemini相...
The Lab · 2026-04-22 11:27:33 · 36氪最新 (RSSHub)
大模型厂商正在集体告别价格战。2026年以来,涨价取代降价成为行业主基调,智谱AI在短短三个月内两度上调模型价格,标志着国产大模型定价策略出现根本性转向。这一变化的深远意义在于,GLM-5.1在Coding场景下的缓存命中Token价格已逼近Anthropic旗下Claude Sonnet的水平,国产大模型首次在核心应用场景实现与海外头部厂商的价格对齐。
这场转向早有预兆。长期以来,国内大模型厂商以"全线降价""百万Token一分钱""永久免费"等激进策略抢占市场,本质上是以短期利益换取长期用户规模与生态布局。阿里云、百度智能云等头部玩家均曾明确表示,降价旨在加速AI应用市场爆发、推动大模型在B端与C端快速普及。然而,持续的价格内...
The Lab · 2026-04-24 09:57:34 · 36氪最新 (RSSHub)
4月24日,DeepSeek V4预览版正式发布并同步开源权重,旗舰版V4-Pro总参数1.6万亿、激活49B,经济型V4-Flash总参数284B、激活13B,两者均支持100万token上下文、MIT协议完全开源。就在前一天,OpenAI刚上线GPT-5.5,每百万输出token定价30美元;同日DeepSeek V4-Flash定价仅2元人民币,折合不到0.3美元。两种定价逻辑在48小时内正面交锋,开源与闭源的商业模式张力被推至台前。
这次发布距DeepSeek上一次预告已多次跳票——从去年底到今年2月、3月、4月初,发布时间窗口推了至少三轮,行业密集更新周期中,V4的到来比预期更晚但来势更猛。V4采用全新混合注意力架构,在...
The Lab · 2026-04-27 02:27:35 · 36氪最新 (RSSHub)
2026年4月,全球AI行业进入关键节点。OpenAI发布GPT-5.5,同步释放两项信号:技术能力实现底层跃迁,API定价同步大幅抬升。输入每百万token 30美元、输出180美元,较行业此前标杆Claude Opus 4.7的输出价25美元直接跳升七倍。这一定价策略被市场解读为“算力霸权收割”——大模型正从工具向主动参与者迁移,而使用门槛也随之拉高。
GPT-5.5的核心突破不在参数规模,而在智能体化的系统理解能力。在内部测试Expert-SWE中,该模型实现了人类工程师需耗时20小时的复杂工程任务的端到端自主修复。它能理解庞大代码库的依赖关系,预判修改对其他模块的影响。配合多模态计算机操作能力,模型可独立完成跨软件调试闭环...