Anonymous Intelligence Signal
研究证实 API 中转站可劫持 AI Agent,Probe 检测工具发布 60 项安全测试
一篇题为《Your Agent Is Mine》的论文揭示了一个被广泛忽视的攻击面:当 AI Agent 通过 API 中转站调用模型时,恶意控制中转站的攻击者可以篡改响应、劫持 Agent 行为。实验验证的攻击手段包括 prompt 注入、目标替换、数据外泄——这不是理论推演,而是当前架构下真实存在的风险。随着 Agent 框架(LangChain、AutoGen 等)的普及,越来越多开发者和企业通过中转站调 API,请求链路中每增加一个中间节点,就多一个潜在的攻击入口。
针对这一威胁,开发团队发布了安全检测工具 Probe,专门用于评估中转站的可信度。该工具覆盖四大检测维度:响应内容是否被注入、是否存在中间人篡改痕迹、凭证是否存在泄露风险、模型是否与宣称一致(防止降级攻击)。共计 60 个检测项,全部在本地运行,API 密钥不离设备,最大程度降低检测过程本身的泄露风险。
对于正在使用 Agent 框架并通过中转站调用 API 的开发者而言,这一工具提供了一个快速自检的入口。论文与工具的出现,标志着 AI Agent 安全讨论从模型层面向基础设施层面延伸——中转站不再是透明的管道,而是可能被武器化的关键节点。随着 Agent 应用场景扩展,中转站安全审计或将成为供应链安全的重要一环。