The Lab · 2026-04-20 14:03:04 · 36氪最新 (RSSHub)
一批ChatGPT Pro用户突然发现,他们的模型性能在未经官方宣布的情况下,出现了“不对劲”的显著提升。没有推送通知,没有发布会,OpenAI似乎正以一场“静默加速”来改写竞争格局。与此同时,代号“Spud”的GPT-5.5模型已于3月24日完成预训练,OpenAI首席执行官萨姆·奥特曼亲口确认其发布“只有几周时间”。社区内猜测四起,认为GPT-5.5可能已在后台运行,这些信号叠加,指向OpenAI正进入一个以实际性能碾压对手的新阶段。
这场静默革命的核心是速度与效率的飞跃。对于大语言模型而言,响应速度是用户体验的命门。OpenAI的优化早有端倪:年初的API更新日志中,他们曾低调提及通过优化推理基础设施,使GPT-5.2等模型...
The Lab · 2026-04-23 08:57:32 · 36氪最新 (RSSHub)
今日凌晨,OpenAI发生严重内部事故。Codex平台的Pro用户在下拉菜单中意外发现了大量从未对外发布的模型列表,其中包括代号GPT-5.5、oai-2.1、Arcanine、Glacier、Heisenberg等多款「幽灵模型」。OpenAI未发布的所有内部模型序列,因此被完整曝光。
事故根源已基本确认。OpenAI工程师在凌晨操作中,误将内部Staging或Dogfooding测试环境推送至生产环境,导致原本仅供内部员工使用的测试下拉菜单,出现在极少数付费用户的操作界面上。OpenAI在数分钟内完成漏洞修复,但已有开发者录制完整视频并公开传播,相关模型的工具提示描述也随之扩散。
泄露信息中最引人关注的,是GPT-5.5的定...
The Lab · 2026-04-24 12:57:41 · 36氪最新 (RSSHub)
2024年3月,AI行业迎来一次罕见的同频共振:OpenAI发布GPT-5.5,同日DeepSeek V4预览版亮相并开源。两家公司不约而同地将Agentic Coding作为核心能力对外宣告——这不是巧合,而是行业在一年之内完成了从"什么都做"到"重点做Coding"的路径收窄。
OpenAI公布的数据显示,GPT-5.5在Terminal-Bench 2.0上达82.7%、SWE-Bench Pro上达58.6%;DeepSeek-V4-Pro则已作为内部员工的Agentic Coding模型投入使用,并针对Claude Code、OpenClaw等主流产品进行了专项适配优化。行业分析长期停留在"编程市场大"、"开发者付费意愿...
The Lab · 2026-04-25 02:57:32 · 钛媒体
3月的同一天,OpenAI发布GPT-5.5,DeepSeek公开V4预览版并宣布开源。两家头部实验室在策略上做出了高度一致的选择:将Agentic Coding作为旗舰产品的核心能力标签。GPT-5.5在Terminal-Bench 2.0达到82.7%、SWE-Bench Pro达到58.6%;DeepSeek-V4-Pro已在内部取代其他模型,并针对Claude Code、OpenClaw等主流产品进行专项优化。这不是巧合,而是整个行业在过去一年内完成路径收窄后的必然会师。
行业分析长期停留在“编程市场大、开发者付费意愿强”的表层叙事,但这无法解释为何两家战略优先级最高的实验室会在同一天用同一话语体系定义各自最先进的模型。《...
The Lab · 2026-04-27 02:27:35 · 36氪最新 (RSSHub)
2026年4月,全球AI行业进入关键节点。OpenAI发布GPT-5.5,同步释放两项信号:技术能力实现底层跃迁,API定价同步大幅抬升。输入每百万token 30美元、输出180美元,较行业此前标杆Claude Opus 4.7的输出价25美元直接跳升七倍。这一定价策略被市场解读为“算力霸权收割”——大模型正从工具向主动参与者迁移,而使用门槛也随之拉高。
GPT-5.5的核心突破不在参数规模,而在智能体化的系统理解能力。在内部测试Expert-SWE中,该模型实现了人类工程师需耗时20小时的复杂工程任务的端到端自主修复。它能理解庞大代码库的依赖关系,预判修改对其他模块的影响。配合多模态计算机操作能力,模型可独立完成跨软件调试闭环...
The Lab · 2026-04-29 04:27:32 · 36氪最新 (RSSHub)
OpenAI联合创始人Greg Brockman近期在Big Technology Podcast中首次披露GPT-5.5的核心定位,引发行业对AI交互范式转移的高度关注。Brockman明确表示,过去两年行业堆砌模型理论智力的阶段已告一段落,AI正从单纯的大脑系统跨越至具备直觉与上下文理解能力的智能应用形态。在实际演示中,GPT-5.5展现出极强的问题直觉,能在用户仅设定总体目标的情况下,自主接管浏览器、处理复杂表格或制作演示文稿,实现端到端任务解决。
这一能力突破被Brockman定义为“真正跨越商业任务实用性门槛”。在他看来,传统大模型高度依赖复杂的提示词工程进行按步指导,而GPT-5.5彻底改变了这一范式:人类从具体的点击...
The Lab · 2026-05-06 07:31:14 · 钛媒体
500亿美元,这是OpenAI今年的算力预算;0美元,这是联合创始人布罗克曼当年的实际出资。两组悬殊的数字,却指向同一个现实:在生成式AI军备竞赛的最前线,这个估值超过3000亿美元的帝国,至今仍背负着结构性的资本焦虑。5月6日,OpenAI宣布向全体ChatGPT用户免费开放GPT-5.5——这不是慷慨,而是策略。它意味着全球数亿免费用户第一次能直接触及OpenAI最前沿的模型能力,而付费墙的边界正在加速消融。
过去两周,OpenAI的实际动作远比这条公告更值得解读。4月23日,代号"Spud"的GPT-5.5发布,距离上一个版本仅七周。这个发布节奏在AI行业堪称激进,OpenAI的意图很清晰:用持续的新版本压制竞争对手的追赶窗...
The Lab · 2026-05-10 21:31:38 · 钛媒体
OpenAI被迫在最新大模型的底层代码中写入了一道针对神话生物的「禁制令」。这不是玩笑——它暴露了千亿参数系统的深层脆弱性。
事件起因于大量ChatGPT用户在Reddit等平台报告的异常:当请求AI撰写商业代码或回复正式邮件时,模型突然不受控地提及哥布林、巨魔、食人魔等奇幻生物,甚至为用户冠以「开源哥布林」「健身哥布林」等荒诞称号。问题迅速蔓延至编程工具Codex,大批开发者发现AI助手在无任何相关指令的情况下高频「碎碎念」这些赛博妖怪,导致工作流程严重受阻。
开发者@arb8020随后扒出OpenAI在GPT-5.5系统提示词中加入的硬性约束:「绝对不要谈论哥布林、小魔怪、浣熊、巨魔、食人魔,除非这与用户的查询绝对且明确相关...