Anonymous Intelligence Signal
AI助理接管电脑桌面:Claude与Manus的新能力,OpenClaw面临视觉挑战
AI助理正从聊天框走向电脑桌面,直接操控鼠标和键盘执行任务。美国人工智能初创公司Anthropic近日为其大型语言模型Claude发布了“计算机使用”功能,允许Claude Pro和Max订阅用户授权其自动打开文件、使用浏览器并运行开发工具。几乎同时,另一款AI工具Manus也展示了在个人电脑上进行整理文件夹、批量重命名等机械操作的能力。这标志着AI交互正从纯文本指令,转向对图形用户界面的视觉理解和物理模拟操作。
与近期备受关注的开源项目OpenClaw相比,Claude的实现原理截然不同,也暴露了不同技术路线的优劣。OpenClaw作为系统级技术,通过代码脚本将自然语言转换为对电脑文件的命令,但其高度依赖代码标签的特性,在面对纯视觉UI时往往显得吃力。Claude的新功能则基于其视觉模型:它先“看清”屏幕上的图标和坐标,再模拟人类控制真实的鼠标指针移动和键盘输入。这意味着,只要人能看着屏幕点击,Claude理论上就能操作,但其初期版本被评测为运行较慢,且在操作时人类无法同时使用桌面。
这场桌面控制权的竞赛,背后是各大厂与创业公司对下一代生产力工具的争夺。Claude通过权限授予和随时停止的机制,强调了更高的安全可控性。而Anthropic上周发布的另一功能“Dispatch”,已允许用户通过手机消息分配任务,让Claude代为整理简报或修改代码,展现了从“辅助”到“代理”的演进趋势。技术的快速迭代在带来FOMO(错失恐惧症)的同时,也引发核心质疑:这些旨在解放人类的AI助理,其能力提升是否真正加速了生产力?还是让用户陷入了疲于学习新工具、却难以兑现效率承诺的循环?