1. ARC-AGI-3 首日惊现黑马:Symbolica AI 以 36% 成绩撕开“全球最难考试”缺口
全球顶尖大模型在号称“AI界最难关卡”的ARC-AGI-3测试中集体翻车,最强模型Opus 4.6仅得0.2%,而人类却能轻松满分。这一结果让业界对当前AI是否接近通用人工智能(AGI)产生了强烈质疑。然而,就在测试发布次日,一家名为Symbolica的公司宣布其AI系统“Agentica”在首日就取得了36.08%的成绩,实现了惊人的反转。这一分数不仅全面碾压了现有大模型的基线,更在182个关卡中成功通关113个,为这场被认为近乎不可能通过的测试撕开了一道关键缺口。 Symbolica的突破性表现,将压力直接传导给了OpenAI、Anthropic等主流模型厂商。ARC-AGI-3的核心挑战在于它是一个交互式黑盒游戏,而非静态的...