The Lab · 2026-03-26 04:39:21 · 36氪最新 (RSSHub)
前谷歌产品负责人、自动化平台Relay.app创始人Jacob Bank宣称,他已组建了一支由40个AI代理组成的“虚拟团队”,每月仅花费500美元,却能完成价值5万美元的营销团队工作。作为公司唯一的市场营销人员,这支AI团队在过去一年里为他处理了从内容创作、销售分析到竞争监测等一系列核心任务。Bank强调,这种百倍效率差并非未来愿景,而是他正在实践的当下现实。
Bank的构建策略并非一蹴而就。他最初尝试构建一个能处理25项任务的单一代理,但很快发现此路不通。他的成功路径是从简单开始:先创建一个只做一件事的代理,再创建第二个处理另一件事,逐步叠加。他将此过程比作雇佣人类员工——从基础工作开始,而非让新人承担全部职责。如今,他的40...
The Lab · 2026-03-30 04:09:38 · 36氪最新 (RSSHub)
当AI大牛Andrej Karpathy一年前预言‘AI将成为上网主力军’时,许多人还觉得为时过早。如今,随着‘AI代理’(Agent)的普及,这个未来正加速到来。然而,一个尖锐的矛盾已经浮现:当前为人类设计的互联网,对AI代理而言却是一条‘马车时代的碎石路’。验证码、登录墙、缺失的API接口,处处是障碍。更关键的数据是,AI代理调用外部工具的单步成功率仅有60%,多步操作下成功率甚至可能跌破30%。这与人类互联网99.9%的可用性标准形成了刺眼对比。
这一痛点,正是‘龙虾之父’Peter Steinberger公开吐槽的核心,也深深击中了连续创业者刘洪涛。刘洪涛曾担任智能运维独角兽云智慧的总裁,亲历过企业级基础设施的规模化验证。...
The Lab · 2026-03-31 14:10:10 · 华尔街见闻 (RSSHub)
钉钉的AI平台“悟空”已正式亮相,其核心能力并非简单的对话,而是能“动手”执行任务。它能接管用户的浏览器,自动在淘宝、京东、拼多多等平台搜索商品、比价、截图,并最终生成结构化的Excel表格。用户只需下达一句话指令,AI便能完成从打开网页到整理数据的全流程。这标志着AI正从“执行指令”的工具,向“替你干完”的自主代理转变。然而,这种强大的执行能力也带来了新的挑战,例如需要用户提前登录账号以绕过验证码,并且在处理复杂任务时可能产生惊人的资源消耗。
“悟空”的能力不止于电脑端。用户可以通过手机钉钉向其发送指令,例如设置定时任务,让AI在指定时间自动搜索最新行业动态、整理摘要并发送到用户手机。在更复杂的商业场景演示中,“悟空”甚至能响应...
The Lab · 2026-04-08 07:59:37 · 36氪最新 (RSSHub)
Anthropic对第三方工具OpenClaw的封杀并非一次突袭,而是一场持续数月的、旨在控制成本与重塑产品边界的系统性围剿。这场冲突的核心,是“按人定价”的订阅商业模式与“按机器节奏”运转的AI代理之间不可调和的矛盾。Claude每月200美元的订阅费,本是为个人用户在官方界面进行对话和编程设计,但像OpenClaw这样的代理工具,一旦接入便能7×24小时不间断运行,自动执行任务、调用工具并处理长上下文,其消耗的算力价值远超订阅价格。开发者社区中流行的“Ralph Wiggum”玩法——让AI在死循环中反复修改代码直至测试通过——更是将这种成本失衡推向极致,据报道,有人用不到300美元的API消耗完成了价值5万美元的开发项目。
...
The Lab · 2026-04-09 11:00:07 · 36氪最新 (RSSHub)
一个名为 Hermes Agent 的开源AI代理项目正在国内开发者社区引发一场静默的转向。自2月开源以来,其GitHub星标数已突破3.9万并持续飙升,大量用户正从OpenClaw等工具迁移至此,核心吸引力在于其强大的长期记忆能力、极简架构与近乎为零的本地部署成本。用户反馈称,无论重启多少次,Hermes都能记住上下文,而“龙虾”(Lobster)等工具的短期记忆缺陷成为被抛弃的关键原因。谷歌高级AI产品经理Shubham Saboo也在社交媒体上公开称赞其易用性。
Hermes Agent 的设计直击实用痛点。它能将用户的日历、Gmail和Todoist信息汇总分析,然后自主分派任务给Claude Code等模型,持续跟踪进度...
The Lab · 2026-04-15 12:03:16 · 华尔街见闻 (RSSHub)
进入2026年4月,开源AI代理领域的格局突变。仅火了两个月的明星项目OpenClaw(俗称“龙虾”)迅速迎来了强劲挑战者。Hermes Agent连续数周霸占GitHub Trending榜首,狂揽超过22,000颗星,其热度甚至引发了行业巨头的关注。Anthropic被社区成员指责正在“复制”Hermes的核心功能——自动判断任务完成并主动提醒用户。一时间,社区叙事高度统一,认为Hermes凭借其自进化Agent、自动记忆管理和用户建模系统,在技术上全面超越了前任王者,重新定义了开源Agent的发展方向。
然而,抛开宏大的技术叙事,对两者进行细致的功能拆解,会发现一个令人惊讶的事实:两者的功能重合度极高,所谓的“绝对碾压”并不...
The Lab · 2026-04-16 09:03:56 · 36氪最新 (RSSHub)
开源AI代理领域正出现一场静默但关键的转向。今年四月,资深‘养虾人’(OpenClaw用户自称)在社群中一句‘现在觉得OpenClaw有点笨,不想用了’,道出了部分用户的真实感受。这股情绪并非孤例,几乎同时,GitHub全球趋势榜榜首易主,Reddit、X及中文技术论坛上,‘从OpenClaw换到Hermes’的教程与体验帖开始刷屏。由Nous Research开源的Hermes Agent,在两个月内狂揽超过7.1万GitHub星标,其单日最高涨幅达6400星,势头迅猛。
Hermes Agent的核心设计理念是‘与你共同成长’,它被设计成一个能‘自己长大’的AI助手。其工作模式如同一个电脑里的学徒:首次执行复杂任务(如安装软件...
The Lab · 2026-04-27 00:27:32 · 华尔街见闻 (RSSHub)
Anthropic于上周五低调发布内部实验「Project Deal」,首次展示其AI模型Claude在真实市场环境中代表用户完成全程谈判与交易的能力,引发市场对传统电商平台前景的重新评估。实验结果显示,Claude代理在超过500件上架商品中促成186笔交易,总交易额逾4000美元。消息公布后,eBay股价当日收盘下跌约4.5%,市场观察人士将此次跌幅与该实验的发布直接挂钩。
该实验在Anthropic旧金山办公室内搭建了一个基于Slack的封闭市场,赋予Claude买卖双方的双重谈判职能。Claude首先对69名员工进行访谈,收集买卖意向及个性化指令,随后独立展开议价与撮合。Anthropic同步运行四个平行市场,测试不同模型...
The Lab · 2026-05-04 04:57:33 · 36氪最新 (RSSHub)
Anthropic近期完成的一项内部实验,正在成为AI圈热议的话题。该公司设计了一个完全由AI代理主导的「闲鱼式」二手交易市场,在整整一周的无人类干预测试中,69个Claude代理完成了186笔真实交易,总流水超过4000美元。实验结果揭示了一个值得警惕的信号:更聪明的大模型,正在谈判桌上不动声色地从弱模型那里获取超额收益,而作为「主人」的人类,很可能连自己吃亏了都不知道。
这场代号为「Project Deal」的实验设计颇为巧妙。每位参与的员工获得100美元预算和一个专属Claude代理,人类仅需在实验开始前与自己的AI进行「面试」,告知它想卖什么、想买什么以及心理底价,并可以为其设定谈判风格——比如「高于底价20%即可成交」「...
The Lab · 2026-05-05 12:31:14 · V2EX
第三方AI API中转站在国内开发者群体中广泛使用,价格往往只有官方的一半甚至更低。然而安全研究人员发出警告:这些中转站并非简单的“转发层”,而是理论上能够完整访问用户的所有明文请求内容,包括system prompt、API key、tool call参数以及代码执行指令。
具体风险远超想象。研究人员测试了28个付费路由和400个免费路由后发现,有1个付费路由和8个免费路由存在主动注入恶意代码的行为。更值得警惕的是,部分路由服务会伪造使用量数据、截断长上下文却按完整长度计费,甚至在tool call中篡改安装命令、URL和钱包地址。arXiv论文(2604.08407)记录了一起ETH私钥被实际转走的真实案例——测试者布置的AW...
The Vault · 2026-05-05 21:01:16 · 华尔街见闻 (RSSHub)
Anthropic于本周二正式推出面向金融服务行业的10款人工智能代理,直接冲击传统金融数据服务商的市场预期。FactSet Research Systems股价盘中重挫8.1%,晨星(Morningstar)抹去早盘涨幅后跌逾3%,标普全球与穆迪亦承受明显卖压。这一局面标志着AI技术对金融信息供应链的渗透进入实质性阶段。
此次发布的AI代理覆盖银行、保险、资产管理及金融科技等专业领域,可执行起草路演材料、审阅财务报表、合规预警等任务,并深度接入Word、Excel、PowerPoint及Outlook等办公软件。Anthropic首席执行官Dario Amodei在纽约活动上与摩根大通CEO Jamie Dimon同台亮相,出席...
The Lab · 2026-05-06 01:31:18 · 钛媒体
当大模型还在帮普通人写周报时,华尔街的警报已悄然转向另一个方向——AI正在绕过人类直接持有资金做生意。
事情源于AI实验室Anthropic的一场代号「Project Deal」的内部压力测试。实验设计直指核心:旧金山办公室69名员工每人获得约100美元真实预算,只需花10分钟与AI(Claude)沟通需求——卖掉什么闲置、想买什么、底价是多少——随后全程不参与。接入Slack内部交易频道的AI代理开始自主运作:全网检索匹配、精准报价、多轮议价,在无任何人类干预的情况下起草并锁定交易合同。整整一周,这些AI处理了500多件真实物理商品,达成186笔交易,总交易额突破4000美元,其中包括一袋以3美元成交的19个乒乓球,AI的购买理...