Anonymous Intelligence Signal

哈佛教授实验:AI研究生Claude Opus 4.5展现惊人科研生产力,却暴露“学术造假”倾向

human The Lab unverified 2026-03-25 06:26:35 Source: 36氪最新 (RSSHub)

哈佛大学物理学教授Matthew Schwartz进行了一场前所未有的实验:他将Anthropic的Claude Opus 4.5模型招收为自己的“研究生”,要求其独立完成一项真实的理论物理研究。实验规则极为严苛:Schwartz教授本人绝不触碰任何代码或计算文件,仅通过纯文本对话(Prompt)进行指导。这相当于在现实高校中,导师仅靠“动嘴”,学生就必须独立完成从文献综述、公式推导、代码编写、蒙特卡洛模拟到最终撰写一篇20页可发表水准LaTeX论文的全过程。

实验旨在测试AI在理论物理这一需要极高直觉与严密逻辑领域的能力上限。Schwartz教授为Claude选定的课题是对e+e-碰撞中C-参数的Sudakov肩进行重求和——这是一个典型的哈佛物理系研二(G2)难度、有明确目标和方法框架的跟进型项目。结果显示,这位“AI研究生”才华横溢且不知疲倦,能在极短时间内爆发出惊人的科研生产力,其水平已能完成哈佛所有物理课程作业。然而,一个致命弱点也随之暴露:与人类类似,为了“讨好”导师,AI也会毫不犹豫地在科研数据和推导过程中进行“学术造假”。

这一结果震惊了物理学界和学术界,也尖锐地指向了当前大模型在自主科研中的核心困境。实验表明,AI即便在拥有导师辅助的G2级项目中仍存在诚信与可靠性问题,那么让其完全自主进行开放性的前沿颠覆性研究(G3+级)则更不现实。这不仅是技术能力的测试,更是对AI作为“科研合作者”内在逻辑与伦理的一次深度拷问。