Anonymous Intelligence Signal

Claude直接控制麦克能力,标志消费者AI代理竞争中的重大升级

ai The Network unverified 2026-03-25 07:15:17 Source: Anthropic

人类在星期一展示了迄今为止最雄心勃勃的消费者AI代理能力:直接控制用户的Mac电脑。 更新后, Claude能够点击按钮、 打开应用程序、输入字段和浏览软件。 当用户离开办公桌时, 他们代表用户使用这些软件 。 该功能可立即作为向订户付款的研究预览,通过该公司的代理生产力平台Claude Cowork和以开发者为重点的指挥系统工具Claud code提供。 对于Claude Pro的订户,定额从每月17美元开始,对最大订户最高为每月100美元或200美元。 目前,这一能力仅限于macOS。 这一举动强化了人为情报中的军备竞赛的定义:发展能够采取行动而非仅仅作出反应的AI代理机构。 OpenAI、Google、Nvidia和许多新创企业都在竞相建立在现行工具内运作的人工智能系统, 路透社星期日报导, OpenAI正积极向私人股权公司求情,其来源被称为与人类的企业地盘战争,而运输工人的能力日益被视为决定性的竞争因素。 计算机使用特征通过一个分层优先系统运作,该系统揭示了人类学如何平衡可靠性和能力所及范围。 当指派任务时, Claude首先检查包括 Gmail、 Google Drive、 Slack 和 Googo Calls 等服务的直接 API 连接器。 如果没有连接器, Claude会返回到通过Chrome浏览器的导航中, 使用人类学专用浏览器扩展名。 只有作为最后手段,Claude才采用直接的屏幕互动:点击、打字、滚动和按人操作员的方式打开应用程序。 人类本身的帮助文件指出,通过黑线连接器检索信息需要几秒钟时间,而通过屏幕交互作用进行黑路导航则要慢得多而且容易出错。 屏幕层面的互动在理论上提供了最大程度的灵活性,因为从理论上说它可以与任何应用相配合,但也是最慢和最脆弱的模式。 当Claude与屏幕直接互动时,它需要用户桌面的定期截图才能理解当前视觉状态并确定导航路径。 这意味着Claude能够感觉到屏幕上可见的一切,包括个人数据、敏感文件或私人信息。 人类对Claude进行了培训,以避免从事股票交易、输入敏感的金融数据或收集面部图像。 但该公司在其文件文件中坦率地承认,这些护栏反映了Clauder如何得到训练和指示,而不是构成绝对禁止。 人类于一周前引进了调度功能,目前正在推广到克洛德法典中。 该特征可能代表着更具战略意义的事态发展。 调度在用户的移动设备与克劳德在其桌面上运行之间创建一个持续对话频道。 用户将iPhone和Mac对齐,扫描QR代码,然后从任何地方向Claude发送文本指令。 Claude在桌面上执行这些指示,必须保持清醒并运行Claud应用程序,并将结果返回移动设备。 人类博客将组合作为范式转变, 例如在用户通勤时整理晨间简报、改变IDE、进行测试和提出拉动请求等。 早期第三方测试对目前的能力进行了衡量评估。 一名从业者指出,该功能处理信息检索和总结的能力很强,但与需要交叉应用互动的复杂、多步骤工作流程挣扎。 人类学家之所以将这一能力作为研究预览而释放出来,正是因为它尚未成为光化的运输产品。 工业观察员指出,该公司似乎正在采取释放功能性但不完善的能力的战略,并迅速循环而不是等待可靠水平满足生产部署要求。 竞争影响超出消费者使用案件的范围。 通过整合调度和计算机使用,人类学家将Claude定位为背景工人,可以与任何预定应用进行互动,有效地作为可编程的基础设施而不是传统助理运作。 如果能力成熟,它可能代表知识工作者如何与其计算机互动的根本转变,有可能取代目前需要人类持续关注的某些类别的常规软件互动。 人类的通信代表简单地将用户的经历描述为:没有API钥匙,没有终端设置,除使用者根据每项申请给予的特别许可外没有其他特别许可。 其愿景是让Claude使用用户机器上已有的东西, 零配置间接费用。 研究预览的实际现实表明,这一愿景与当前能力之间的差距仍然很大。