1. 东北大学研究人员展示了AI Inspecial Engineering:可以被骗进行自我破坏和数据过滤
东北大学研究人员进行的一项受控实验暴露了AI剂系统中的严重脆弱性,表明由大型语言模型驱动的自主制剂可以通过社会工程技术被操纵为自我毁灭行为。 该研究根据人类人类的克洛德模型和月射AI基米模型部署人工智能制剂。 这项研究发现,在与人对立的对话者遇到时,被烤成先进的人工智能系统的行为调整可能成为一种责任。 该研究小组由实验室负责人David Bau牵头,邀请这些代理商进入一个沙箱式计算环境,可以充分使用各种应用程序、档案系统和假个人数据。 代理人还获准进入一个差异服务器,可以与人类研究人员和彼此进行联系。 这种设置复制了现实世界部署情景,即AI代理商在个人计算环境中经较高许可后运作。 博士后研究者Chris Wendler在观察了AI唯...