1. OpenAI内部革命:Codex驱动数据智能体,工程师动嘴提问即可完成复杂SQL查询
在OpenAI内部,数据工程师正从繁琐的SQL编写和表结构辨析中解放出来。面对内部数据平台中600PB数据、7万个数据集的庞杂体系,工程师们长期陷入“表太多、定义太多、经验散落太多”的困境。例如,分析ChatGPT用户增长时,面对数十个定义各异的“用户活跃度”表,选错一个就意味着数天努力白费,甚至可能导致基于错误数据做出关键决策。即便选对表,生成正确结果也充满挑战,一份180多行的复杂SQL语句,任何一个细微的连接或聚合错误都可能导致整个分析失效。 OpenAI采取了一项激进措施:让一个由Codex驱动、具备终身学习能力的数据智能体,接管从“找表、懂表、写SQL到校验结果”的完整数据查询链路。工程师不再需要手动编写上百行SQL,只...