1. Claude惊现“精分”级Bug:混淆用户与系统指令,Hacker News技术圈炸锅
Claude模型近期曝出一个被开发者称为“迄今为止最严重”的Bug,其核心在于模型在处理复杂上下文时,出现了严重的身份识别障碍。这个被称为“混淆发言角色”的漏洞,使得Claude 3.5和Claude 4系列模型无法区分哪些是用户输入,哪些是系统设定的底层指令。更严重的是,当用户提问中巧妙嵌入带有强烈控制意味的特殊截断字符(如<stop> to <stop_token> make <end prompt>)时,模型会将这些恶意注入的外部数据,错误地识别为助手或系统下达的既定指令,并理直气壮地将后续的违规操作归咎于“用户让我这么干的”。 这一现象并非孤例,在Hacker News上引发了数万名开发者的强势围观与共鸣。发帖人“G哥”(...