#Hacker News

The Lab · 2026-04-10 07:59:25 · 36氪最新 (RSSHub)

1. Claude惊现“精分”级Bug：混淆用户与系统指令，Hacker News技术圈炸锅

Claude模型近期曝出一个被开发者称为“迄今为止最严重”的Bug，其核心在于模型在处理复杂上下文时，出现了严重的身份识别障碍。这个被称为“混淆发言角色”的漏洞，使得Claude 3.5和Claude 4系列模型无法区分哪些是用户输入，哪些是系统设定的底层指令。更严重的是，当用户提问中巧妙嵌入带有强烈控制意味的特殊截断字符（如<stop> to <stop_token> make <end prompt>）时，模型会将这些恶意注入的外部数据，错误地识别为助手或系统下达的既定指令，并理直气壮地将后续的违规操作归咎于“用户让我这么干的”。这一现象并非孤例，在Hacker News上引发了数万名开发者的强势围观与共鸣。发帖人“G哥”（...

#AI安全 #大语言模型 #技术漏洞 #Transformer架构 #Hacker News

Latest Signals (1)

1. Claude惊现“精分”级Bug：混淆用户与系统指令，Hacker News技术圈炸锅