Anonymous Intelligence Signal

字节暂停豆包AI眼镜,千问、豆包卡位Agent“开机键”:入口之争改写AI硬件逻辑

human The Lab unverified 2026-04-22 02:03:28 Source: 钛媒体

大模型公司为何纷纷押注硬件?答案藏在Token消耗暴涨的背后。据《晚点LatePost》报道,火山引擎豆包大模型日均调用量已超120万亿Token,半年增长4倍。然而,当AI竞争从生成式问答转向执行任务,一个根本问题浮现:这些海量Token究竟从哪里被触发,通过什么物理接口进入用户的生活?过去两年,答案是手机屏幕和对话框。但随着OpenClaw等Agent应用将AI从开发者工具推向大众,“随时随地触发AI执行”的需求密度骤增,执行链路急需一个更靠近用户身体的物理锚点。

字节跳动内部已决定暂停豆包AI眼镜项目,这揭示了巨头对入口路径的不同选择。豆包选择以“操作系统级合作”模式切入AI手机赛道,通过与手机厂商深度绑定,获得识别屏幕UI元素、模拟人工操作的核心权限。而千问则押注眼镜,其AI眼镜上线了话费充值、扫码骑车、停车缴费等首批“AI办事”能力,让AI直接在真实世界完成任务。两条路径的本质,是两家公司对同一个工程问题的不同答案:究竟由谁来充当Agent执行链路的物理接口。

这场入口之争,源于AI成本结构的根本性改写。过去两年的价格战已将Token单价压低了约300倍,但Agent类应用让单次任务的Token消耗从普通对话的几十倍起跳。据腾讯科技报道,有技术团队启用Claude Code后,首月支出高达2400美元,经过八周密集优化才勉强降至680美元。Token支出管理本身已变成一项专门技能。这一成本压力在源头上重塑了产品竞争逻辑——谁掌握了Agent的“开机键”与触发入口,谁就可能在控制成本的同时,定义下一代人机交互的规则。硬件,正成为大模型公司争夺Token流量与用户场景的关键工程答案。