The Lab · 2026-03-26 11:39:38 · 36氪最新 (RSSHub)
GitHub一项即将生效的新政策,将开发者与AI助手Copilot的日常交互数据,直接变成了训练自家模型的默认“食材”。从2026年4月24日起,使用Copilot免费版、专业版和高级专业版的个人开发者,其输入、输出的代码片段、上下文乃至开发导航模式,都将被默认用于改进GitHub的AI模型。这一“强行授权”式的数据使用规则,迅速在开发者社区中引发了对AI工具数据边界的新一轮激烈讨论。
此次政策更新精准区分了用户群体。受影响的仅限于个人用户使用的Copilot Free、Pro和Pro+版本。而付费更高的Copilot Business和Enterprise企业版用户则不受影响,其交互数据不会被用于训练。GitHub在公告中详细列...
The Lab · 2026-03-30 07:39:41 · 36氪
智象未来(HiDream.ai)与诺亦腾机器人(Noitom Robotics)的战略合作,直接瞄准了当前AI训练中最稀缺的资源之一:高质量、规模化的具身智能视频数据。这并非一次简单的技术交流,而是旨在年内产出“数万小时以上”视频数据的深度绑定。具身智能要求AI通过视觉、运动等多模态数据理解并交互物理世界,此类数据的获取成本极高、标注极其复杂,已成为制约行业发展的关键瓶颈。
此次合作是两家在各自领域拥有深厚技术积累公司的强强联合。智象未来在AI生成与多模态理解方面具有优势,而诺亦腾机器人则在动作捕捉、机器人运动控制与物理交互数据采集上处于领先地位。双方的合作模式很可能是将诺亦腾机器人从真实物理场景中采集的原始动作与交互数据,通过智...
The Lab · 2026-04-07 06:59:41 · 36氪
智元机器人正式开源其核心资产——AGIBOT WORLD 2026数据集,标志着具身智能领域的数据壁垒出现关键性松动。该数据集并非一次性释放,而是规划了五个阶段的持续开源路径,旨在逐步覆盖更广泛的研究主题与真实世界场景。这种分阶段、有节奏的开源策略,既显示了智元在数据积累上的深度,也为其在行业生态中建立长期影响力铺路。
据了解,AGIBOT WORLD 2026数据集构建于海量真实场景之上,并围绕五大具身领域研究主题进行结构化组织。每个主题都配备了专属的数据采集方法与一套精细化的标注体系,这直接针对了当前具身智能研发中高质量、多模态数据稀缺的核心痛点。数据的真实性与系统性,使其成为训练和验证下一代机器人感知、决策与控制算法的宝贵资...
The Office · 2026-04-23 06:27:36 · 界面新闻 (RSSHub)
北京市东城区人民法院近期宣判一起引发AI行业高度关注的刑事案件:科技公司算法工程师王某因非法删除公司AI训练数据,被以破坏计算机信息系统罪判处有期徒刑五年十个月。该案系北京市首例以非法删除训练数据为手段、破坏人工智能模型的刑事案件,案件背后暴露出企业算力资源管理的深层漏洞。
2024年9月,王某在东城某科技公司任职期间,为利用公司算力资源“干私活”,违规登录公司服务器集群,输入了行业内公认的“删库跑路代码”——一条强制删除指令,在一夜之间将AI游戏部门超过89TB的训练数据全部删除,并导致多个自主研发的文生3D AI模型彻底损毁。系统功能随即瘫痪,研发项目全面停摆,初步评估经济损失达20余万元。承办检察官指出,王某声称删除数据系为...
The Lab · 2026-04-24 00:27:49 · 知乎热榜 (RSSHub)
路透社、Business Insider 等外媒本周二披露的一份内部备忘录显示,Meta 正在美国员工的办公电脑上部署一款新型追踪软件,系统性记录员工的鼠标移动轨迹、点击行为及键盘输入内容,并间歇性截取屏幕画面,以数据形式喂养其人工智能模型。该工具隶属内部代号为「模型能力计划」(Model Capability Initiative,MCI)的项目,由一名 AI 研究科学家发布在 Meta 超级智能实验室(MSL)的内部团队频道中。
备忘录明确指出,该计划旨在弥补 AI 模型在高精度复现人类与计算机交互方面的短板——包括操作下拉菜单、使用键盘快捷键等高频工作场景。文件写道:「每一位 Meta 员工都能通过单纯地完成日常工作,来协助...
The Office · 2026-04-24 12:57:33 · 36氪最新 (RSSHub)
22岁即登顶全球最年轻白手起家亿万富豪榜单,23岁的布伦丹·富迪(Brendan Foody)正面临其创立的AI数据标注初创公司Mercor的一系列严峻挑战。这家成立仅两年的公司,今年年化营收已突破10亿美元,估值达100亿美元,却在快速扩张中暴露出严重的内部管控漏洞。据《福布斯》披露,Mercor首席执行官方才22岁,便已在公司全员大会上直接以“舞弊”(Fraud)一词警示全员,措辞之直白在公司内部引发震动。
事件核心指向一名负责Anthropic合作项目的主管——Anthropic正是Mercor最重要的客户之一,为其开发人工智能模型Claude提供训练数据。据四名参会知情人士透露,该主管涉嫌招揽自己的父亲与兄弟充当外包“专家...
The Office · 2026-04-27 02:57:35 · 36氪最新 (RSSHub)
全球社交媒体巨头Meta在72小时内连续抛出两条震动硅谷的重磅消息:一边宣布将于5月20日起裁减约10%员工、涉及近8000个岗位并冻结6000个招聘名额,另一边却被曝光正通过收集员工鼠标轨迹、键盘输入、点击位置及屏幕录屏数据来训练AI模型。这种左手裁员、右手监控的割裂操作,让Meta在AI时代甫一登场便陷入信任危机。
Meta首席人力资源官珍妮尔·盖尔在公司内部备忘录中将裁员定性为“必要的取舍”,声称目的是“让公司更高效地运营,并抵消其他领域的投资成本”。然而这份语焉不详的表述非但未能平息质疑,反而在社交媒体上激起了更大反弹:中国网友援引热播剧《潜伏》台词暗讽Meta管理层“既要矿工挖矿、又要清退矿工”,直指其决策逻辑的自相矛盾...
The Lab · 2026-05-07 07:01:14 · 36氪最新 (RSSHub)
2025年被视为人形机器人"量产元年",但水面之下,一道冰冷的裂痕正在威胁整个产业的商用进程:数据缺口。当前具身智能领域的高质量真实数据规模约在50万小时左右,而单个技能点达到交付级所需的数据量高达2000至5000小时甚至更多。这意味着行业现有数据存量几乎只够支撑数十个技能点——距离大规模商用所需的数万量级,缺口触目惊心。
三条数据获取路径已出现分野。前两条路径被不同程度证伪:互联网视频与合成数据虽规模庞大(数亿至数百亿小时),但缺乏真实物理交互,无法解决技能操作泛化问题;真机遥操与动捕数据目前仅有数万小时规模,与硬件高度耦合且扩展成本高达约180美元/小时,难以规模化。真正被寄予厚望的是第三条路——无本体真人数据:直接采集真实...
The Lab · 2026-05-07 12:31:17 · 36氪最新 (RSSHub)
2026年4月,台积电在北美技术研讨会上释放了一个明确信号:人形机器人已被正式纳入其核心产业版图。台积电将人形机器人定义为“Agentic AI(智能体AI)+ Physical AI(物理AI)”的结合体,并系统性地拆解为四大技术象限——大脑、感知、运动、电力,分别对应AP、连接芯片、传感器、MCU、PMIC等芯片体系。这家半导体巨头已明确提出:未来三年内,将与人形机器人芯片相关的产能扩大两倍。硬件侧的路线图已然清晰,变现时间表已写入董事会决议。
然而,一个致命的问题至今悬而未决:谁来为这些芯片提供足够的数据“养料”?文本大模型的训练语料以百亿小时计,而目前具身智能高质量数据的全行业存量仅有约50万小时。从50万小时到百亿小时量...