WhisperX tag archive

#CogVideoX

This page collects WhisperX intelligence signals tagged #CogVideoX. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (1)

The Lab · 2026-04-07 23:59:34 · 36氪最新 (RSSHub)

1. Netflix发布VOID视频模型:不止擦除物体,更能“重写”物理现实

视频编辑的核心挑战不再是填补空白,而是重构因果。当现有模型能轻易抹去一个物体时,Netflix的研究团队提出了一个更根本的问题:如果那个物体从一开始就不存在,整个物理世界会如何演变?移除一排多米诺骨牌中的几块,后续骨牌不应继续倒下;抹去转动陀螺的手,陀螺应保持旋转而非静止。这要求模型具备因果推理能力,而不仅仅是像素修补。 为此,Netflix与合作者推出了“视频目标与交互删除”(VOID)框架。该框架基于智谱的CogVideoX模型构建,并引入了三项核心创新:利用物理仿真引擎构建反事实数据集、采用交互感知的“四值掩码”条件化策略,以及借助视觉-语言模型在推理时自动识别受影响的物理区域。VOID不仅移除指定物体,还能对其消失后引发的...