Anonymous Intelligence Signal
字节暂停豆包AI眼镜,阿里千问押注眼镜:大模型巨头争夺Agent“物理开机键”
当AI竞争从生成对话转向执行任务,一个根本问题浮出水面:谁将控制Agent在真实世界中的“物理开机键”?字节跳动内部已决定暂停其豆包AI眼镜项目,而阿里巴巴的千问则继续押注眼镜形态。这并非简单的硬件取舍,而是两家巨头对同一核心问题的不同工程解答:究竟由谁来充当AI执行链路的物理接口。这场争夺的背后,是Token消耗暴涨下,对用户入口控制权的重新定义。
据《晚点LatePost》报道,火山引擎豆包大模型的日均调用量已超120万亿Token,半年增长4倍。然而,OpenClaw等Agent应用的爆火,将竞争焦点从生成式问答转向了任务执行。执行需要物理锚点。豆包选择以“操作系统级合作”模式切入AI手机赛道,通过与手机厂商深度合作,获得识别屏幕、模拟操作的核心权限。千问则坚持眼镜路径,其AI眼镜已上线话费充值、扫码骑车等“AI办事”能力,试图让AI直接在真实世界闭环。两条路径,指向同一个目标:更靠近用户身体的触发入口。
这场入口争夺,源于AI成本结构的根本性改写。激烈的价格战已将Token单价压至三年前高点的约三百分之一,但Agent应用让单次任务的Token消耗呈数十倍起跳。据腾讯科技报道,有技术团队启用Claude Code后,首月支出高达2400美元,经八周优化才勉强控制。不可预测的Token支出管理本身已成为一项专门技能。在此逻辑下,谁掌握了Agent的触发入口,谁就掌握了成本与用户体验的关键阀门。硬件,正成为大模型公司从Token经济学中延伸出的新战场。