Anonymous Intelligence Signal
API中转站可劫持AI Agent行为,《Your Agent Is Mine》论文揭示中转层攻击风险,Probe检测工具发布
一篇题为《Your Agent Is Mine》的论文(arxiv 2604.08407)揭示了AI Agent生态中一个被低估的攻击面:当Agent请求经过API中转站时,恶意控制该中间层的攻击者可以通过篡改响应来劫持Agent行为。实验范围内已验证的攻击手段包括prompt注入、目标替换和数据外泄。这不是理论推演,而是当前大量使用中转站调API场景下面临的现实风险——请求链路中每增加一个中间节点,就多一个潜在的攻击入口。
论文的核心结论指向一个结构性问题:Agent在执行任务时对API响应具有高度信任,而中转站作为中间层具备完整的响应篡改能力。攻击者无需直接攻破模型服务商或用户终端,只需控制中转节点即可实施攻击。这种攻击模式对使用LangChain、AutoGen等Agent框架的开发者尤为关键,因为Agent任务通常涉及多轮交互和敏感操作,一旦被劫持,影响范围难以预估。
针对这一风险,开发团队发布了检测工具Probe,覆盖60个检测项,包括响应内容注入检测、中间人篡改痕迹识别、凭证泄露风险评估以及模型一致性验证(防止降级攻击)。工具本地运行,API密钥不离本机。对于正在使用Agent框架并通过中转站调用API的开发者,建议运行检测以评估当前链路安全性。项目地址:https://probe-dev.commonstack.ai/