WhisperX tag archive

#视频生成

This page collects WhisperX intelligence signals tagged #视频生成. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (17)

The Lab · 2026-03-25 09:40:00 · 36氪

1. 快手财报亮出AI王牌：可灵AI单月收入破2000万美元，年化运行率剑指2.4亿美元

快手最新财报中，其AI业务“可灵”已成为不容忽视的增长引擎。2025年第四季度，可灵AI营收达到3.4亿元人民币，其中仅12月单月收入就突破2000万美元。按此势头计算，其年化收入运行率已高达2.4亿美元，标志着快手在AI商业化道路上取得了关键性突破。这一数据不仅验证了其AI产品的市场接受度，更揭示了AI正从技术投入迅速转化为实质性的财务回报。财报亮眼的背后，是快手可灵AI在技术产品上的密集迭代与发布。自2025年第四季度以来，可灵AI先后推出了统一多模态视频模型“可灵O1”、具备“音画同出”能力的“可灵2.6”模型，以及基于“All-in-One”理念打造的“可灵3.0”系列模型。这一系列动作清晰地展示了快手在生成式AI，尤其...

#人工智能 #财报 #商业化 #视频生成 #生成式AI

The Vault · 2026-03-25 15:39:23 · 虎嗅 (RSSHub)

2. 快手财报：AI新星“可灵”增长未达机构乐观预期，传统业务承压拖累股价

快手最新财报揭示了其AI战略转型中的关键张力：被视为估值新引擎的AI视频生成模型“可灵”，其增长势头未能完全匹配年初资本市场的狂热预期，而传统核心业务正面临政策、竞争与成本的多重压力。尽管Q4整体业绩略超预期，利润改善主要源于运营提效，但市场更关注的增长叙事——尤其是“可灵”能否持续高增长以抵消老业务的疲软——正面临考验。2月以来的股价调整，部分反映了投资者在“AI想象力”与“现实业绩压力”之间的重新权衡。具体来看，“可灵”在去年12月凭借2.6版本的新功能实现单月流水2000万美元的历史新高，一度推高了机构对Q4收入的预期至3.5-4亿元人民币区间。然而，实际Q4收入为3.4亿元，仅处于公司指引与市场预期区间的下沿，未达最乐观...

#财报分析 #AI模型 #视频生成 #港股 #估值重估

The Lab · 2026-03-26 23:39:32 · 36氪最新 (RSSHub)

3. OpenAI突然终止Sora项目，中国AI竞争压力与算力回报考量成关键因素

OpenAI在2026年3月25日正式宣布终止其AI视频生成模型Sora，包括面向消费者和开发者的所有版本，并明确不会在ChatGPT中集成视频功能。这一决定标志着两年前被誉为“世界模拟器”、被认为将颠覆影视行业的明星项目戛然而止。就在外界预期OpenAI将与字节跳动等公司在AI视频领域展开激烈竞速时，Sora却主动“退赛”，其突然死亡引发了行业对AI赛道战略转向的深度审视。 OpenAI官方给出的理由是“释放计算资源，聚焦核心业务”。直白而言，即公司认为将宝贵的算力持续投入Sora项目未能带来可预见的商业回报，因此决定将资源重新配置到更具盈利潜力的企业级产品上。回顾其发展历程，Sora在2024年初凭借一段“红衣女郎走在东京街头...

#人工智能 #Sora #视频生成 #算力资源 #战略调整

The Lab · 2026-03-30 08:39:33 · 36氪最新 (RSSHub)

4. 昆仑万维周亚辉：OpenAI弃守视频赛道，中国军团迎来窗口期

OpenAI宣布关停Sora独立入口一个多月后，质疑视频生成模型‘烧钱太猛、商业化太远’的声音尚未消散，昆仑万维董事长兼CEO周亚辉却给出了截然不同的判断。他认为，视频大模型本身是能挣钱的，做不好只能怪自己。他更直言，OpenAI团队的动荡——被Meta挖空——才是其战略收缩的内因，而这场‘撤退’恰好为中国公司腾出了领先的位置。作为国内一级市场知名的‘独角兽捕手’，周亚辉在2023年生成式AI爆发之初便亲自下场，创立专注大模型的天工AI，并停止了个人投资。面对外界对AI研发‘烧钱’导致持续亏损的担忧，他给出了一个明确的投入底线：要保证模型在全球处于领先地位，每个月最少要投入一个亿的研发费用。昆仑万维是一家海外收入占比超过90%的...

#AI大模型 #视频生成 #周亚辉 #OpenAI #Sora

The Lab · 2026-03-31 00:10:09 · 36氪

5. 马斯克透露：xAI旗下Grok Imagine已实现正毛利，强调视频生成是AGI关键

埃隆·马斯克在社交媒体上透露，其人工智能公司xAI的图像生成模型Grok Imagine已实现正毛利。这一声明直接回应了外界对AI项目烧钱模式的普遍质疑，表明该产品在商业上已迈过盈亏平衡点，成为xAI旗下罕见的非亏损项目。马斯克将这一进展置于更宏大的技术愿景中，明确指出人工智能的未来核心在于视频的理解与生成。马斯克强调，光子是迄今为止带宽最高的通信方式，因此视频生成能力是通往通用人工智能（AGI）的必备工具。这一论断不仅为Grok Imagine的商业化成功提供了技术背书，也清晰地勾勒出xAI乃至整个行业下一阶段的竞争焦点。与许多仍深陷巨额研发投入的AI项目相比，Grok Imagine率先实现正向现金流，这为xAI在激烈的AG...

#人工智能 #AGI #埃隆·马斯克 #商业化 #视频生成

The Lab · 2026-03-31 10:39:13 · 钛媒体

6. Sora猝死退场，字节等中国大厂AI视频积分价格暴涨，下半场格局突变

全球AI视频竞赛突现戏剧性转折。2026年3月24日，OpenAI毫无预兆地宣布全面关停其明星产品Sora，独立App下架、API接口掐断、ChatGPT内置入口抹除，整个过程没有缓冲和预警。更令人错愕的是，据路透社爆料，就在公告发出前半小时，迪士尼高管还在与OpenAI洽谈一项涉及10亿美元投资和超200个超级IP授权的重大合作，会议结束后便收到了项目终结的通知。这场“猝死”不仅终结了一个技术神话，也瞬间改变了全球生成式AI视频领域的竞争格局。 Sora的退场并非纯粹的技术溃败，其背后是难以承受的“词元”之重与经济账的彻底失衡。视频生成是生成式AI领域的“吞金兽”，与处理文本或静态图像不同，AI需要在时间轴上疯狂计算以维持物理规...

#Sora #生成式AI #视频生成 #字节跳动 #算力成本

The Lab · 2026-04-02 04:29:46 · 36氪

7. 万兴科技旗下万兴剧厂首批上线“满血版”Seedance 2.0，打通AI真人剧与漫剧工业化制作

AIGC软件A股上市公司万兴科技，已通过旗下焕新平台“万兴剧厂”正式首批上线其“满血版”Seedance 2.0模型的全能力。此举标志着该公司正将其AI视频生成技术推向更专业、更工业化的应用层级，旨在为内容创作领域提供一套整合度极高的解决方案。全新升级的万兴剧厂核心在于打通了从AI真人剧到2D/3D漫剧的工业化制作全流程，并集成了参考图生视频等多种工作流。平台支持文本、视频、音频、真人实拍等多模态组合输入，实现了所谓的“导演级”控制。具体功能包括智能补全剧情、自动匹配音效配乐与口型同步，并能确保剧中人物、场景、音色的一致性，最终可批量直接输出2K高清分镜视频。此次“满血版”模型的上线，意味着万兴科技正试图在竞争激烈的AIGC...

#AIGC #视频生成 #Seedance #万兴剧厂 #工业化制作

The Lab · 2026-04-07 23:59:34 · 36氪最新 (RSSHub)

8. Netflix发布VOID视频模型：不止擦除物体，更能“重写”物理现实

视频编辑的核心挑战不再是填补空白，而是重构因果。当现有模型能轻易抹去一个物体时，Netflix的研究团队提出了一个更根本的问题：如果那个物体从一开始就不存在，整个物理世界会如何演变？移除一排多米诺骨牌中的几块，后续骨牌不应继续倒下；抹去转动陀螺的手，陀螺应保持旋转而非静止。这要求模型具备因果推理能力，而不仅仅是像素修补。为此，Netflix与合作者推出了“视频目标与交互删除”（VOID）框架。该框架基于智谱的CogVideoX模型构建，并引入了三项核心创新：利用物理仿真引擎构建反事实数据集、采用交互感知的“四值掩码”条件化策略，以及借助视觉-语言模型在推理时自动识别受影响的物理区域。VOID不仅移除指定物体，还能对其消失后引发的...

#人工智能 #视频生成 #物理模拟 #因果推理 #CogVideoX

The Lab · 2026-04-10 03:00:01 · 界面新闻 (RSSHub)

9. 阿里AI视频大模型HappyHorse一周后发布，已登顶全球开源视频竞技榜

阿里巴巴的AI视频生成大模型“HappyHorse”即将在一周后正式对外发布。据知情人士透露，该模型已在阿里百炼平台内部上架，标志着其商业化进程进入最后冲刺阶段。此次发布将直接挑战当前全球视频生成领域的竞争格局。 HappyHorse的锋芒已提前显露。就在4月8日，其1.0版本以“黑马”姿态，在权威的Artificial Analysis视频竞技场排行榜上，以1333的Elo评分登顶全球榜首。更关键的是其竞技表现：它对知名模型OVI 1.1的胜率高达80%，对LTX 2.3的胜率也达到60.9%。这一成绩使其成为目前全球排名最高的开源视频生成模型，技术实力得到初步验证。此次发布将阿里直接推入了全球AI视频生成竞赛的核心战场。H...

#AI大模型 #视频生成 #开源模型 #阿里巴巴 #人工智能竞赛

The Lab · 2026-04-10 07:59:33 · 华尔街见闻 (RSSHub)

10. 阿里“欢乐马”视频模型匿名登顶全球榜单，碾压字节Seedance 2.0引发市场震动

阿里巴巴正式“认领”了在AI圈引发广泛猜测的神秘视频生成模型“欢乐马”（HappyHorse），并确认其正在内测。这一举动标志着阿里在竞争白热化的视频AI赛道取得了迄今最强的公开成绩，其模型以匿名形式在全球知名AI评测平台Artificial Analysis的榜单上，将字节跳动旗下的Seedance 2.0挤至第二位，直接提振了阿里股价盘中上涨逾4%。 “欢乐马”的亮相方式极为罕见：没有发布会，没有技术博客，没有任何公司背书，直接以匿名形式登顶。榜单数据显示，在文本生视频（不含音频）赛道，HappyHorse-1.0的Elo得分达到1379分，较Seedance 2.0高出106分，也高于昆仑万维、快手等公司的同类产品。在图像生...

#人工智能 #视频生成 #AI模型评测 #字节跳动 #科技竞争

The Lab · 2026-04-10 08:59:43 · 华尔街见闻 (RSSHub)

11. 阿里“欢乐马”屠榜AI视频评测，郑波团队从商业场景杀入多模态战场

一匹代号“欢乐马”的AI视频模型，在全球权威评测平台Artificial Analysis的Video Arena榜单上突然空降榜首，在文生视频和图生视频两个赛道均位列第一，将字节跳动的Seedance 2.0等强劲对手拉下王座。这匹“黑马”的成色由数千名用户盲测投票决定，品牌滤镜和刷榜在此机制下基本失效，其1365分的榜首成绩，在图生视频赛道上领先第二名高达48分，含金量十足。谜底很快揭晓：HappyHorse-1.0出自阿里巴巴。据华尔街见闻确认，该模型由阿里ATH事业群的郑波团队研发，目前正处于内测阶段，将于近期开放API。郑波此前的履历写满了搜索、推荐和广告技术，曾担任淘宝搜推算法负责人、阿里妈妈CTO及淘天集团算法技术...

#人工智能 #多模态AI #视频生成 #郑波 #ATH事业群

The Lab · 2026-04-10 10:30:04 · 华尔街见闻 (RSSHub)

12. 阿里Wan2.7视频大模型登顶DesignArena，以68分优势领先Grok Imagine

阿里巴巴在视频生成AI领域的布局迎来关键性突破。其最新发布的大模型Wan2.7，在权威评测平台DesignArena的“视频到视频”功能排行榜上，以1334的Elo评分强势登顶。这一分数不仅超越了榜单上的其他竞争者，更以68分的显著优势，领先于排名第二的马斯克旗下xAI的Grok Imagine模型（1266分）。这一成绩直接宣告了阿里在视频生成技术第一梯队的稳固地位。 Wan2.7-Video系列模型于一周前刚刚发布，其定位并非单一功能，而是一个覆盖视频创作全链路的“全家桶”。该系列包含文生视频、图生视频、参考生视频和视频编辑四大核心模型，旨在为用户提供全面的创作控制力。其核心亮点在于“一句话编辑”能力，用户仅需通过自然语言指令...

#人工智能 #视频生成 #大模型 #DesignArena #Grok

The Lab · 2026-04-10 11:29:52 · 36氪最新 (RSSHub)

13. 阿里“欢乐马”屠榜AI视频评测：郑波团队从商业场景杀入多模态战场

一匹代号“欢乐马”的AI视频模型，在全球权威评测平台Artificial Analysis的Video Arena榜单上突然空降榜首，在文生视频和图生视频两个赛道均位列第一，将字节跳动的Seedance 2.0拉下王座。这匹“黑马”的身份迅速引发全网猜测，谜底很快揭晓：HappyHorse-1.0出自阿里巴巴集团，由ATH事业群郑波团队研发，目前正处于内测阶段，将于近期开放API。消息确认后，资本市场迅速反应，阿里股价应声飘红。 HappyHorse的“屠榜”成绩含金量十足。在Artificial Analysis的评分机制下，数千名用户进行盲测，排除了品牌滤镜和刷榜的可能。HappyHorse以1365分位列文生视频第一，领先第...

#人工智能 #多模态AI #视频生成 #阿里巴巴ATH #郑波

The Lab · 2026-04-13 03:33:16 · 36氪最新 (RSSHub)

14. 蔡浩宇AI公司Anuttacon低调发布LPM 1.0：首个实时全双工视频角色表演大模型

蔡浩宇创办的AI公司Anuttacon，通过其技术团队成员AilingZeng在X平台悄然发布了首个视频大模型LPM 1.0。这款模型被定位为“面向单人全双工音视频对话的角色表演大模型”，直接挑战当前视频生成领域在表现力、实时推理与长时身份稳定性上难以兼顾的核心痛点。其核心突破在于实现了实时视频生成、无限时长身份一致生成与细腻拟人化表演，标志着AI在创造具有持续、稳定人格的虚拟角色方面迈出了关键一步。 LPM 1.0是一个多模态输入模型，仅需一张图片、可选参考图片、音频及文本，即可生成角色表演视频。其技术关键在于构建了以人为中心的多模态数据集，并训练了170亿参数的Base LPM，再将其蒸馏为低延迟的流式Online LPM。模...

#AI大模型 #视频生成 #虚拟角色 #实时交互 #蔡浩宇

The Lab · 2026-04-15 08:33:48 · 36氪最新 (RSSHub)

15. OmniRoam突破长视频生成瓶颈：全景视频新范式实现轨迹可控漫游

生成式视频技术正面临从“片段”到“长时序”的艰难跨越。当前模型虽能产出高质量短视频，但在生成长时间、可连续演化的视频序列时，视角变化导致的结构漂移与内容不一致问题凸显，视频在时空维度上极易失控，陷入“走着走着就乱了”的困境。与此同时，如何让视频生成具备可控性，能够严格沿指定路径连续移动，已成为从实验室走向实际应用的关键门槛。近日，由加州大学欧文分校、加州大学圣地亚哥分校、香港城市大学、宾夕法尼亚大学及Adobe Research的研究者联合提出的OmniRoam，为这一难题提供了新解法。该方法通过引入全景视频作为统一表示，并结合从粗到精的分阶段生成框架，在长时序条件下显著提升了视频的空间一致性与时间连贯性。其核心创新在于将相机轨...

#人工智能 #视频生成 #计算机视觉 #OmniRoam #长视频生成

The Lab · 2026-04-16 09:33:31 · 钛媒体

16. 阿里“可灵之父”张迪五个月反戈一击，匿名视频大模型HappyHorse-1.0登顶榜单

中国AI视频生成领域的竞争，已从单纯的技术比拼，演变为顶级“棋手”的争夺战。阿里近日认领的匿名视频大模型HappyHorse-1.0，在权威的Artificial Analysis Video Arena榜单上，将字节跳动的Seedance 2.0从榜首位置拉下马，引发行业震动。更关键的是，这款模型背后站着的，是曾为快手打造出标志性产品“可灵”的核心人物——张迪。他离开快手、短暂停留B站后闪电回归阿里，仅用五个月便带队交出这份成绩单，标志着大厂间的顶尖人才攻防战进入白热化阶段。张迪的职业生涯轨迹，精准勾勒出这场人才争夺战的激烈轮廓。他早年深耕阿里，后转战快手并担任技术副总裁，一手主导了“可灵”的底层架构，为快手在AI视频赛道筑起...

#人工智能 #大模型 #人才争夺 #张迪 #视频生成

The Lab · 2026-04-18 06:32:57 · 36氪最新 (RSSHub)

17. 阿里世界模型「快乐生蚝」上线：实时交互，挑战谷歌与李飞飞的AI视频范式

AI视频生成赛道杀出一匹黑马。一个名为“快乐生蚝”（HappyOyster）的模型悄然上线，其背后是阿里巴巴今年3月新成立的ATH创新事业群。这并非阿里首次突袭榜单，此前其“欢乐马”模型曾登顶Artificial Analysis排行榜，引发行业猜测。如今，“快乐生蚝”以“可实时构建和交互的开放式世界模型”为定位，直接切入当前AI视频生成的核心竞争领域，标志着阿里正试图在谷歌、李飞飞Runway等主导的路径之外，开辟一条强调实时性与用户交互的“第三条路”。与多数需要“写提示词、等待渲染、输出成片”的模型不同，“快乐生蚝”基于原生多模态架构，主打“漫游”和“导演”两大功能。其“漫游”功能号称是首个支持任意风格、无限互动的通用世界模...

#人工智能 #世界模型 #多模态AI #视频生成 #阿里巴巴ATH