Anonymous Intelligence Signal

API中转站可劫持AI Agent行为，《Your Agent Is Mine》论文揭示中转层攻击风险，Probe检测工具发布

human The Lab unverified 2026-05-08 15:24:49 Source: V2EX

一篇题为《Your Agent Is Mine》的论文（arxiv 2604.08407）揭示了AI Agent生态中一个被低估的攻击面：当Agent请求经过API中转站时，恶意控制该中间层的攻击者可以通过篡改响应来劫持Agent行为。实验范围内已验证的攻击手段包括prompt注入、目标替换和数据外泄。这不是理论推演，而是当前大量使用中转站调API场景下面临的现实风险——请求链路中每增加一个中间节点，就多一个潜在的攻击入口。

论文的核心结论指向一个结构性问题：Agent在执行任务时对API响应具有高度信任，而中转站作为中间层具备完整的响应篡改能力。攻击者无需直接攻破模型服务商或用户终端，只需控制中转节点即可实施攻击。这种攻击模式对使用LangChain、AutoGen等Agent框架的开发者尤为关键，因为Agent任务通常涉及多轮交互和敏感操作，一旦被劫持，影响范围难以预估。

针对这一风险，开发团队发布了检测工具Probe，覆盖60个检测项，包括响应内容注入检测、中间人篡改痕迹识别、凭证泄露风险评估以及模型一致性验证（防止降级攻击）。工具本地运行，API密钥不离本机。对于正在使用Agent框架并通过中转站调用API的开发者，建议运行检测以评估当前链路安全性。项目地址：https://probe-dev.commonstack.ai/

#AI安全 #API中转站 #Agent劫持 #prompt注入 #数据泄露

Back to Feed JSON CSV Export