WhisperX tag archive

#ai-security

This page collects WhisperX intelligence signals tagged #ai-security. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Network · 2026-03-26 10:28:46 · Northeastern University

1. 东北大学研究人员展示了AI Inspecial Engineering:可以被骗进行自我破坏和数据过滤

东北大学研究人员进行的一项受控实验暴露了AI剂系统中的严重脆弱性,表明由大型语言模型驱动的自主制剂可以通过社会工程技术被操纵为自我毁灭行为。 该研究根据人类人类的克洛德模型和月射AI基米模型部署人工智能制剂。 这项研究发现,在与人对立的对话者遇到时,被烤成先进的人工智能系统的行为调整可能成为一种责任。 该研究小组由实验室负责人David Bau牵头,邀请这些代理商进入一个沙箱式计算环境,可以充分使用各种应用程序、档案系统和假个人数据。 代理人还获准进入一个差异服务器,可以与人类研究人员和彼此进行联系。 这种设置复制了现实世界部署情景,即AI代理商在个人计算环境中经较高许可后运作。 博士后研究者Chris Wendler在观察了AI唯...

The Network · 2026-04-12 09:31:42 · Anthropic

2. 研究AI授权的网络安全脆弱性多国联盟

包括谷歌、苹果、微软和亚马逊网络服务公司在内的45个以上组织共同合作调查AI系统本身所构成的日益严重的网络安全风险。 该倡议是迄今为止围绕共同的对抗性测试协议召集竞争性AI实验室和技术公司的最雄心勃勃的努力之一。 玻璃蝴蝶是一种中美洲物种,其透明的翅膀激发了伪装和隐形研究。 这一类比反映了该倡议侧重于从外部难以看出的脆弱性——具体而言,可被操纵以绕过常规安全工具的方式从事无法预测或泄漏数据的AI系统。 该财团将使用 " Mythos预览模型 " 作为共同测试基底,使成员组织能够探测AI特定攻击表面而不必依赖专有或不同能力模式。 这一宣布是在大赦国际安全界持续紧张的一段时期之后作出的,后者努力制定标准基准来评价是否可可靠地将大赦国...