Anonymous Intelligence Signal
Netflix开源AI视频模型VOID,以物理因果理解能力改写后期制作经济模型
Netflix首次将其AI视频模型推向开源领域,在Hugging Face上发布了名为VOID(Video Object and Interaction Deletion)的视频物件与互动删除模型。该模型采用Apache 2.0许可证,意味着任何人都可免费使用甚至商用。此举标志着这家流媒体巨头正式在AI视频赛道亮牌,其核心目标并非从零生成内容,而是赋予电影人前所未有的后期控制力,直接冲击传统后期制作的经济模型。
VOID旨在解决后期制作中一个长期存在的痛点:从画面中移除物体容易,但让场景看起来仿佛该物体从未存在过则极其困难。传统方法常导致违背物理规律的视觉伪影,例如移除一个抱着吉他的人后,吉他会悬浮在空中。VOID的核心创新在于其能“理解物理因果关系”。通过其独创的Quadmask(四值掩码)系统,模型将画面划分为移除区、过渡区、受影响区和保留区,不仅指示AI“擦除”什么,更指导“擦除后”剩余物体应如何自然运动。此外,其两阶段推理流程专门用于修复视频扩散模型常见的物体变形伪影。
在内部盲测中,VOID的表现已展现出显著优势。一项涵盖25名参与者、横跨多种场景的调查显示,VOID以64.8%的偏好率胜出,远超排名第二的Runway(18.4%)。论文展示的案例极具说服力:它能移除对撞视频中的一辆车,让剩余车辆在干净路面上继续行驶;移除跳入泳池的人后,水面波澜不惊。这种能力或将大幅压缩好莱坞视效团队过去需要数周才能完成的修复工作,从根本上重塑视频后期制作的成本与流程。