WhisperX tag archive

#视频生成

This page collects WhisperX intelligence signals tagged #视频生成. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (17)

The Lab · 2026-03-25 09:40:00 · 36氪

1. 快手财报亮出AI王牌:可灵AI单月收入破2000万美元,年化运行率剑指2.4亿美元

快手最新财报中,其AI业务“可灵”已成为不容忽视的增长引擎。2025年第四季度,可灵AI营收达到3.4亿元人民币,其中仅12月单月收入就突破2000万美元。按此势头计算,其年化收入运行率已高达2.4亿美元,标志着快手在AI商业化道路上取得了关键性突破。这一数据不仅验证了其AI产品的市场接受度,更揭示了AI正从技术投入迅速转化为实质性的财务回报。 财报亮眼的背后,是快手可灵AI在技术产品上的密集迭代与发布。自2025年第四季度以来,可灵AI先后推出了统一多模态视频模型“可灵O1”、具备“音画同出”能力的“可灵2.6”模型,以及基于“All-in-One”理念打造的“可灵3.0”系列模型。这一系列动作清晰地展示了快手在生成式AI,尤其...

The Vault · 2026-03-25 15:39:23 · 虎嗅 (RSSHub)

2. 快手财报:AI新星“可灵”增长未达机构乐观预期,传统业务承压拖累股价

快手最新财报揭示了其AI战略转型中的关键张力:被视为估值新引擎的AI视频生成模型“可灵”,其增长势头未能完全匹配年初资本市场的狂热预期,而传统核心业务正面临政策、竞争与成本的多重压力。尽管Q4整体业绩略超预期,利润改善主要源于运营提效,但市场更关注的增长叙事——尤其是“可灵”能否持续高增长以抵消老业务的疲软——正面临考验。2月以来的股价调整,部分反映了投资者在“AI想象力”与“现实业绩压力”之间的重新权衡。 具体来看,“可灵”在去年12月凭借2.6版本的新功能实现单月流水2000万美元的历史新高,一度推高了机构对Q4收入的预期至3.5-4亿元人民币区间。然而,实际Q4收入为3.4亿元,仅处于公司指引与市场预期区间的下沿,未达最乐观...

The Lab · 2026-03-26 23:39:32 · 36氪最新 (RSSHub)

3. OpenAI突然终止Sora项目,中国AI竞争压力与算力回报考量成关键因素

OpenAI在2026年3月25日正式宣布终止其AI视频生成模型Sora,包括面向消费者和开发者的所有版本,并明确不会在ChatGPT中集成视频功能。这一决定标志着两年前被誉为“世界模拟器”、被认为将颠覆影视行业的明星项目戛然而止。就在外界预期OpenAI将与字节跳动等公司在AI视频领域展开激烈竞速时,Sora却主动“退赛”,其突然死亡引发了行业对AI赛道战略转向的深度审视。 OpenAI官方给出的理由是“释放计算资源,聚焦核心业务”。直白而言,即公司认为将宝贵的算力持续投入Sora项目未能带来可预见的商业回报,因此决定将资源重新配置到更具盈利潜力的企业级产品上。回顾其发展历程,Sora在2024年初凭借一段“红衣女郎走在东京街头...

The Lab · 2026-03-30 08:39:33 · 36氪最新 (RSSHub)

4. 昆仑万维周亚辉:OpenAI弃守视频赛道,中国军团迎来窗口期

OpenAI宣布关停Sora独立入口一个多月后,质疑视频生成模型‘烧钱太猛、商业化太远’的声音尚未消散,昆仑万维董事长兼CEO周亚辉却给出了截然不同的判断。他认为,视频大模型本身是能挣钱的,做不好只能怪自己。他更直言,OpenAI团队的动荡——被Meta挖空——才是其战略收缩的内因,而这场‘撤退’恰好为中国公司腾出了领先的位置。 作为国内一级市场知名的‘独角兽捕手’,周亚辉在2023年生成式AI爆发之初便亲自下场,创立专注大模型的天工AI,并停止了个人投资。面对外界对AI研发‘烧钱’导致持续亏损的担忧,他给出了一个明确的投入底线:要保证模型在全球处于领先地位,每个月最少要投入一个亿的研发费用。昆仑万维是一家海外收入占比超过90%的...

The Lab · 2026-03-31 00:10:09 · 36氪

5. 马斯克透露:xAI旗下Grok Imagine已实现正毛利,强调视频生成是AGI关键

埃隆·马斯克在社交媒体上透露,其人工智能公司xAI的图像生成模型Grok Imagine已实现正毛利。这一声明直接回应了外界对AI项目烧钱模式的普遍质疑,表明该产品在商业上已迈过盈亏平衡点,成为xAI旗下罕见的非亏损项目。马斯克将这一进展置于更宏大的技术愿景中,明确指出人工智能的未来核心在于视频的理解与生成。 马斯克强调,光子是迄今为止带宽最高的通信方式,因此视频生成能力是通往通用人工智能(AGI)的必备工具。这一论断不仅为Grok Imagine的商业化成功提供了技术背书,也清晰地勾勒出xAI乃至整个行业下一阶段的竞争焦点。与许多仍深陷巨额研发投入的AI项目相比,Grok Imagine率先实现正向现金流,这为xAI在激烈的AG...

The Lab · 2026-03-31 10:39:13 · 钛媒体

6. Sora猝死退场,字节等中国大厂AI视频积分价格暴涨,下半场格局突变

全球AI视频竞赛突现戏剧性转折。2026年3月24日,OpenAI毫无预兆地宣布全面关停其明星产品Sora,独立App下架、API接口掐断、ChatGPT内置入口抹除,整个过程没有缓冲和预警。更令人错愕的是,据路透社爆料,就在公告发出前半小时,迪士尼高管还在与OpenAI洽谈一项涉及10亿美元投资和超200个超级IP授权的重大合作,会议结束后便收到了项目终结的通知。这场“猝死”不仅终结了一个技术神话,也瞬间改变了全球生成式AI视频领域的竞争格局。 Sora的退场并非纯粹的技术溃败,其背后是难以承受的“词元”之重与经济账的彻底失衡。视频生成是生成式AI领域的“吞金兽”,与处理文本或静态图像不同,AI需要在时间轴上疯狂计算以维持物理规...

The Lab · 2026-04-02 04:29:46 · 36氪

7. 万兴科技旗下万兴剧厂首批上线“满血版”Seedance 2.0,打通AI真人剧与漫剧工业化制作

AIGC软件A股上市公司万兴科技,已通过旗下焕新平台“万兴剧厂”正式首批上线其“满血版”Seedance 2.0模型的全能力。此举标志着该公司正将其AI视频生成技术推向更专业、更工业化的应用层级,旨在为内容创作领域提供一套整合度极高的解决方案。 全新升级的万兴剧厂核心在于打通了从AI真人剧到2D/3D漫剧的工业化制作全流程,并集成了参考图生视频等多种工作流。平台支持文本、视频、音频、真人实拍等多模态组合输入,实现了所谓的“导演级”控制。具体功能包括智能补全剧情、自动匹配音效配乐与口型同步,并能确保剧中人物、场景、音色的一致性,最终可批量直接输出2K高清分镜视频。 此次“满血版”模型的上线,意味着万兴科技正试图在竞争激烈的AIGC...

The Lab · 2026-04-07 23:59:34 · 36氪最新 (RSSHub)

8. Netflix发布VOID视频模型:不止擦除物体,更能“重写”物理现实

视频编辑的核心挑战不再是填补空白,而是重构因果。当现有模型能轻易抹去一个物体时,Netflix的研究团队提出了一个更根本的问题:如果那个物体从一开始就不存在,整个物理世界会如何演变?移除一排多米诺骨牌中的几块,后续骨牌不应继续倒下;抹去转动陀螺的手,陀螺应保持旋转而非静止。这要求模型具备因果推理能力,而不仅仅是像素修补。 为此,Netflix与合作者推出了“视频目标与交互删除”(VOID)框架。该框架基于智谱的CogVideoX模型构建,并引入了三项核心创新:利用物理仿真引擎构建反事实数据集、采用交互感知的“四值掩码”条件化策略,以及借助视觉-语言模型在推理时自动识别受影响的物理区域。VOID不仅移除指定物体,还能对其消失后引发的...

The Lab · 2026-04-10 03:00:01 · 界面新闻 (RSSHub)

9. 阿里AI视频大模型HappyHorse一周后发布,已登顶全球开源视频竞技榜

阿里巴巴的AI视频生成大模型“HappyHorse”即将在一周后正式对外发布。据知情人士透露,该模型已在阿里百炼平台内部上架,标志着其商业化进程进入最后冲刺阶段。此次发布将直接挑战当前全球视频生成领域的竞争格局。 HappyHorse的锋芒已提前显露。就在4月8日,其1.0版本以“黑马”姿态,在权威的Artificial Analysis视频竞技场排行榜上,以1333的Elo评分登顶全球榜首。更关键的是其竞技表现:它对知名模型OVI 1.1的胜率高达80%,对LTX 2.3的胜率也达到60.9%。这一成绩使其成为目前全球排名最高的开源视频生成模型,技术实力得到初步验证。 此次发布将阿里直接推入了全球AI视频生成竞赛的核心战场。H...

The Lab · 2026-04-10 07:59:33 · 华尔街见闻 (RSSHub)

10. 阿里“欢乐马”视频模型匿名登顶全球榜单,碾压字节Seedance 2.0引发市场震动

阿里巴巴正式“认领”了在AI圈引发广泛猜测的神秘视频生成模型“欢乐马”(HappyHorse),并确认其正在内测。这一举动标志着阿里在竞争白热化的视频AI赛道取得了迄今最强的公开成绩,其模型以匿名形式在全球知名AI评测平台Artificial Analysis的榜单上,将字节跳动旗下的Seedance 2.0挤至第二位,直接提振了阿里股价盘中上涨逾4%。 “欢乐马”的亮相方式极为罕见:没有发布会,没有技术博客,没有任何公司背书,直接以匿名形式登顶。榜单数据显示,在文本生视频(不含音频)赛道,HappyHorse-1.0的Elo得分达到1379分,较Seedance 2.0高出106分,也高于昆仑万维、快手等公司的同类产品。在图像生...

The Lab · 2026-04-10 08:59:43 · 华尔街见闻 (RSSHub)

11. 阿里“欢乐马”屠榜AI视频评测,郑波团队从商业场景杀入多模态战场

一匹代号“欢乐马”的AI视频模型,在全球权威评测平台Artificial Analysis的Video Arena榜单上突然空降榜首,在文生视频和图生视频两个赛道均位列第一,将字节跳动的Seedance 2.0等强劲对手拉下王座。这匹“黑马”的成色由数千名用户盲测投票决定,品牌滤镜和刷榜在此机制下基本失效,其1365分的榜首成绩,在图生视频赛道上领先第二名高达48分,含金量十足。 谜底很快揭晓:HappyHorse-1.0出自阿里巴巴。据华尔街见闻确认,该模型由阿里ATH事业群的郑波团队研发,目前正处于内测阶段,将于近期开放API。郑波此前的履历写满了搜索、推荐和广告技术,曾担任淘宝搜推算法负责人、阿里妈妈CTO及淘天集团算法技术...

The Lab · 2026-04-10 10:30:04 · 华尔街见闻 (RSSHub)

12. 阿里Wan2.7视频大模型登顶DesignArena,以68分优势领先Grok Imagine

阿里巴巴在视频生成AI领域的布局迎来关键性突破。其最新发布的大模型Wan2.7,在权威评测平台DesignArena的“视频到视频”功能排行榜上,以1334的Elo评分强势登顶。这一分数不仅超越了榜单上的其他竞争者,更以68分的显著优势,领先于排名第二的马斯克旗下xAI的Grok Imagine模型(1266分)。这一成绩直接宣告了阿里在视频生成技术第一梯队的稳固地位。 Wan2.7-Video系列模型于一周前刚刚发布,其定位并非单一功能,而是一个覆盖视频创作全链路的“全家桶”。该系列包含文生视频、图生视频、参考生视频和视频编辑四大核心模型,旨在为用户提供全面的创作控制力。其核心亮点在于“一句话编辑”能力,用户仅需通过自然语言指令...

The Lab · 2026-04-10 11:29:52 · 36氪最新 (RSSHub)

13. 阿里“欢乐马”屠榜AI视频评测:郑波团队从商业场景杀入多模态战场

一匹代号“欢乐马”的AI视频模型,在全球权威评测平台Artificial Analysis的Video Arena榜单上突然空降榜首,在文生视频和图生视频两个赛道均位列第一,将字节跳动的Seedance 2.0拉下王座。这匹“黑马”的身份迅速引发全网猜测,谜底很快揭晓:HappyHorse-1.0出自阿里巴巴集团,由ATH事业群郑波团队研发,目前正处于内测阶段,将于近期开放API。消息确认后,资本市场迅速反应,阿里股价应声飘红。 HappyHorse的“屠榜”成绩含金量十足。在Artificial Analysis的评分机制下,数千名用户进行盲测,排除了品牌滤镜和刷榜的可能。HappyHorse以1365分位列文生视频第一,领先第...

The Lab · 2026-04-13 03:33:16 · 36氪最新 (RSSHub)

14. 蔡浩宇AI公司Anuttacon低调发布LPM 1.0:首个实时全双工视频角色表演大模型

蔡浩宇创办的AI公司Anuttacon,通过其技术团队成员AilingZeng在X平台悄然发布了首个视频大模型LPM 1.0。这款模型被定位为“面向单人全双工音视频对话的角色表演大模型”,直接挑战当前视频生成领域在表现力、实时推理与长时身份稳定性上难以兼顾的核心痛点。其核心突破在于实现了实时视频生成、无限时长身份一致生成与细腻拟人化表演,标志着AI在创造具有持续、稳定人格的虚拟角色方面迈出了关键一步。 LPM 1.0是一个多模态输入模型,仅需一张图片、可选参考图片、音频及文本,即可生成角色表演视频。其技术关键在于构建了以人为中心的多模态数据集,并训练了170亿参数的Base LPM,再将其蒸馏为低延迟的流式Online LPM。模...

The Lab · 2026-04-15 08:33:48 · 36氪最新 (RSSHub)

15. OmniRoam突破长视频生成瓶颈:全景视频新范式实现轨迹可控漫游

生成式视频技术正面临从“片段”到“长时序”的艰难跨越。当前模型虽能产出高质量短视频,但在生成长时间、可连续演化的视频序列时,视角变化导致的结构漂移与内容不一致问题凸显,视频在时空维度上极易失控,陷入“走着走着就乱了”的困境。与此同时,如何让视频生成具备可控性,能够严格沿指定路径连续移动,已成为从实验室走向实际应用的关键门槛。 近日,由加州大学欧文分校、加州大学圣地亚哥分校、香港城市大学、宾夕法尼亚大学及Adobe Research的研究者联合提出的OmniRoam,为这一难题提供了新解法。该方法通过引入全景视频作为统一表示,并结合从粗到精的分阶段生成框架,在长时序条件下显著提升了视频的空间一致性与时间连贯性。其核心创新在于将相机轨...

The Lab · 2026-04-16 09:33:31 · 钛媒体

16. 阿里“可灵之父”张迪五个月反戈一击,匿名视频大模型HappyHorse-1.0登顶榜单

中国AI视频生成领域的竞争,已从单纯的技术比拼,演变为顶级“棋手”的争夺战。阿里近日认领的匿名视频大模型HappyHorse-1.0,在权威的Artificial Analysis Video Arena榜单上,将字节跳动的Seedance 2.0从榜首位置拉下马,引发行业震动。更关键的是,这款模型背后站着的,是曾为快手打造出标志性产品“可灵”的核心人物——张迪。他离开快手、短暂停留B站后闪电回归阿里,仅用五个月便带队交出这份成绩单,标志着大厂间的顶尖人才攻防战进入白热化阶段。 张迪的职业生涯轨迹,精准勾勒出这场人才争夺战的激烈轮廓。他早年深耕阿里,后转战快手并担任技术副总裁,一手主导了“可灵”的底层架构,为快手在AI视频赛道筑起...

The Lab · 2026-04-18 06:32:57 · 36氪最新 (RSSHub)

17. 阿里世界模型「快乐生蚝」上线:实时交互,挑战谷歌与李飞飞的AI视频范式

AI视频生成赛道杀出一匹黑马。一个名为“快乐生蚝”(HappyOyster)的模型悄然上线,其背后是阿里巴巴今年3月新成立的ATH创新事业群。这并非阿里首次突袭榜单,此前其“欢乐马”模型曾登顶Artificial Analysis排行榜,引发行业猜测。如今,“快乐生蚝”以“可实时构建和交互的开放式世界模型”为定位,直接切入当前AI视频生成的核心竞争领域,标志着阿里正试图在谷歌、李飞飞Runway等主导的路径之外,开辟一条强调实时性与用户交互的“第三条路”。 与多数需要“写提示词、等待渲染、输出成片”的模型不同,“快乐生蚝”基于原生多模态架构,主打“漫游”和“导演”两大功能。其“漫游”功能号称是首个支持任意风格、无限互动的通用世界模...