AI News Hub Logo

AI News Hub

AI Video Generation: Sweeping Reshuffle in Just 90 Days

36Kr
任晓渔

AI视频生成,狂飙洗牌九十天数智前线·2026年05月06日 20:27模型能力和商业化落地狂飙猛进的三个月。 过去90多天里,AI视频生成赛道经历了一场密集竞速和狂飙。 “我们产品版本每天都在更新,恨不得上午一个版,下午一个版”,AI视频创作平台MovieFlow联合创始人梁巍告诉数智前线,今年以来他们更新迭代速度非常迅猛,一个邀测版本推出不久,后面还有五六个版本排队等发布。 这种紧迫感并非个

AI视频生成,狂飙洗牌九十天数智前线·2026年05月06日 20:27模型能力和商业化落地狂飙猛进的三个月。 过去90多天里,AI视频生成赛道经历了一场密集竞速和狂飙。 “我们产品版本每天都在更新,恨不得上午一个版,下午一个版”,AI视频创作平台MovieFlow联合创始人梁巍告诉数智前线,今年以来他们更新迭代速度非常迅猛,一个邀测版本推出不久,后面还有五六个版本排队等发布。 这种紧迫感并非个例。 基模厂商自不必提。从年初Seedance 2.0刷新行业标准,到赛道开启者OpenAI关停Sora,之后是可灵AI在3月快手财报会上披露ARR突破3亿美元,进入4月伊始匿名黑马HappyHorse 1.0登顶Artificial Analysis视频竞技场排行榜后阿里认领……过去三个月,这条赛道在模型能力和商业化落地上正经历着一场剧烈震荡。 伴随着基模以周为单位的更新迭代,围绕着多模态生成的产业链中下游也随之产生了连锁反应。 一方面,基模能力进步正快速拉高创作者的下限,一些此前受限于团队下限很难实现的多团队快速协同现在有了实现可能,AI影视等场景里工业化流程正加速到来。 另一方面,中下游的应用服务商也在这场竞速中加速卷起来,产品推新节奏加快,行业的转化链路都也被极快催化,比如AI短剧赛道快速洗牌,一些公司入场即退场。下游的产品使用者们也敏锐追踪着模型和产品能力的最新,一位用户告诉数智前线,一旦确认某类场景里性能更优、价格更划算,他们“不会有任何包袱,会在一夜之间完成切换”。 01 各领风骚一百天 过去三个月里,多模态生成赛道可谓风云变幻。 年初Seedance 2.0横空出世,评测视频刷屏之后,不少业界人士都将之视作划时代的产品。 “这是人类历史上第一次AI视频有可能完全代替人类传统影视工作流的起点。AI真正做到了自动化地把剪辑、特效后期等传统流程都在中前期直接融合。"有好莱坞特效从业背景、现任某AI影视公司特效总监的姜来在一档播客节目提到,Seedance2.0将极大加速AI影视的工业化进程。 电商爆款视频AI工具企业Create OK合伙人张锦也在Seedance2.0发布一周测了几个实操过的Case,感受到了它的SOTA能力。张锦告诉数智前线,“在真人感上跟Sora2差不多,相比之前的Seedance 1.5有质的提升。而且根据参考图/参考视频的demo,可以精确地参考人物形象和视频动作,生成特定的打斗动作,当时其他模型完全做不到这一点”。 但行业领先者的出现并不意味着战争已经结束。实际上,今年以来这一赛道的迭代和演进反而前所未有的加速,正以周为单位高速轮替。 从1月底可灵3.0和Vidu Q3先后落地,到2月初xAI Grok Imagine以低价切入投流场景,再到2月中Seedance 2.0以断档领先的表现重置行业认知——这一切发生在不到四周之内。 3月,谷歌Veo 3.1 Lite和Grok同步把海外API定价压到0.05美元每秒,同月Sora正式关停。4月,阿里密集出牌:Wan 2.7落地、HappyHorse匿名屠榜后揭晓身份、月底灰度上线开放API。其间爱诗科技发布影视专项模型PixVerse C1,百度开源ERNIE-Image。不到三个月,全球主要玩家几乎都有动作,实现了一个完整的代际轮替。 领先模型的能力,在快速更迭下很快就成为了行业标配。比如音画同步,从去年底可灵2.6落地到今年1月Vidu Q3和可灵3.0跟进,2月Seedance 2.0将其做到"原生联合生成"高度,4月HappyHorse又以开源姿态加入,不到半年,这项能力已从“差异化卖点”变成了行业标配。 另外,多参模式曾是Vidu在影视内容生产时锁定生成画面一致性的杀手锏,但很快Seedance等头部模型就跟进整合到了最新版本里。 爱诗科技企服负责人孙伟哲在今年3月的一场行业峰会演讲中将基模的进步和快速迭代描述为“各领风骚一两个月”。孙伟哲称行业高速迭代是这一领域常态,“过去两年行业一直在快速迭代,一两个月之后时间窗口也就过去了。” 与基模快速迭代同步的是商业化挑战也前所未有——3月底OpenAI正式宣布关停Sora。作为视频生成赛道的开启者,也是全球AI视频产品标杆,此前Sora2上线2个月时曾传出其60天用户留存率接近零。海外媒体还报道Sora日均推理成本约1500万美元,总生命周期收入仅约210万美元。 目前大模型落地应用标杆在代码生成等场景,Anthropic旗下的Claude Code今年年初ARR突破25亿美元,有分析称OpenAI关停Sora原因之一也是要聚焦精力到收益转化更为突出的企业级产品如代码生成等赛道。 随着Sora关停,在算力成本是文本大模型数十倍甚至上百倍的多模态生成赛道,如何更好完成商业化落地和应用是所有厂商的必答题。Sora的失败揭示了独立的消费级视频产品在当前算力成本下的挑战,倒逼其他厂商加速构建闭环链路。 海外,Google 3月底在Marketing Live大会上宣布,正式将生成式视频模型Veo整合至Google Ads的素材工坊(Asset Studio)中。国内厂商字节先是在剪映等字节跳动系产品里内测产品,之后又宣布将Seedance模型整合到了国际版capcut之中,并且字节采取了B端和C端两条腿并重的策略,推出了分层定价方案,随着C端需求火爆模型调用价格还出现了多次调整和上涨。 AI视频创业公司也在今年重视与行业和场景需求更紧密结合。爱诗科技孙伟哲提到,他们去年开始强调落地,今年加速贴近场景和需求端,将企业服务作为重要方向,推出面向影视行业的C系列专有模型,同时与芒果TV、掌阅等内容平台深度合作。 这些动作意味着,生态优势和内容-流量-变现的闭环对于多模态生成场景的竞争已经越来越重要。IDC一份报告中也指出,炫技时代结束,实用、可控、可落地才是核心竞争力国产模型厂商清空了浮躁的对标焦虑,却也让全球赛道进入了更残酷的“自研淘汰赛”。 02 抽卡率下降十倍,价格涨了近五倍 伴随着基模领域高速迭代和商业落地提速的,是中下游应用生态的快速变化。  一方面,随着模型能力快速提升,在影视制作场景工业化进程大大加速,完成了从原来的“开盲盒”到“工业化精准创作”的转变,这将拓宽AI视频的应用场景。  AI影视创作者姜来提到,以前“想做多团队快速协同是很复杂和困难的事情,生产质量可能参差不齐,效率很容易被个体的下限所拖累”。而基模能力提升,像Seedance 2.0这样的模型具备了自动分镜、音画同步、多镜头叙事等能力,“模型的镜头语言已经比普通分镜师的质感要好”。  这让多团队以动态分镜为核心进行标准化协作有了可能,大大加速AI影视的工业化流程。以前AI视频领域是自媒体创作者之间竞争,今年专业影视制作团队会下场,姜来认为,今年是专业AI从业者与个人创作者之间会拉开水平差距的一年。  谊燊影视创始人杨晨亮告诉数智前线,seedance 2.0大大降低了抽卡率,影视制作场景从开盲盒,有望走向精准创作,“Seedance 2.0出来后,整个AI短剧领域链条的运作模式都变了”。  在此之前,模型能力不够导致做成想要的画面需要大量抽卡,抽卡比例最差时达到1:20。这使得短剧或漫剧制作需要大量抽卡师。这种机制下不少承制方甚至跟一些高校合作,用实习生来降低人力成本,通过实习生来完成抽卡。  而模型能力大幅提升后,抽卡的比例大幅下降到了1:2左右,经常只要有一两次抽卡就能出现符合目标的场景和画面。这使得抽卡师的角色不再必要,但是来负责生成的角色需要有导演思维、镜头感、画面审美的执行导演来完成。  “抽卡率大幅下降,但是单次调用的成本变高了,比如Seedance 2.0,720P画质1秒1元左右,它相比之前大概贵了五倍左右,废片率比之前降低十倍,可用性大幅提升。”不过,杨晨亮也认为, 虽然工具在不断迭代升级,影视制作还是要做资产,分镜等,无论工具迭代速度如何,最终决定生产质量的依然是制作人员的影视制作专业能力。  “今年到明年,传统影视里面AI画面占比会占到50%左右。”MovieFlow联合创始人梁巍观察,基模能力提升不只是Seedance独有,全球范围内多模态模型的快速进化迭代,将使得接下来影视制作方式有望发生极大变化。一部电影原来从交剧本到拍摄,筹备的过程大概要几个月,现在完全可以5天用AI要拍摄的电影先做一遍,然后再去看真正实拍的部分哪些要拍,哪些不用拍。  Seedance 2.0官网示例视频。  同样的逻辑也在电商广告场景里上演。多模态基模能力进步,让长时长、自由态数字人的复杂指令控制变得可能,电商数字人场景今年数字人正从“站桩念稿”能做到“手持商品、实时换装”。一位电商直播数字人服务商此前告诉数智前线,从业者估算2026年直播数字人市场规模相比去年会翻倍。  另一方面,基模快速迭代,内容供给端能力打开,吸引了更多元的入局者,这带来了模型调用量剧烈增长和内容产能大爆炸。但需求端并未随之同步增长,下游的商业变现竞争激烈程度不言而喻。  腾讯视频孙忠怀此前就提到,在AI时代,内容供给将出现十倍甚至百倍级增长,但观众注意力不会同比增长。  DataEye数据则显示,2025年全年上线漫剧60946部,其中播放量破亿的仅96部,爆款率只有0.16%。到2026年2月,在播漫剧数量已暴涨至12万部,一个月的规模是去年全年的两倍水平,但破亿作品不足150部,爆款率进一步跌至0.12%。  这也造就了过去几个月AI视频赛道里的生存奇观——Token调用规模量攀升,生成时间大排队,调用价格一再上涨,但AI漫剧分成比例下调,超九成AI短剧公司在亏损。  整个赛道狂飙猛进,产业链上下游快速磨合,“行业迭代速度很快,快到你根本没办法在这么短的时间内定出一个模式来。等有了初步的熟悉模式,发现技术又迭代了,模式马上又要变。”杨晨亮说。 03 缝隙里吹气球和正在扩大的市场 AI视频创作应用过去几个月里也在快速调整和适应市场的变化。 Sora退出,就让一些应用商快速调整了产品介绍和定位。数智前线观察,有厂商此前主打Sora2工作流来服务下游电商用户,Sora2线下后,他们很快改了产品介绍页面,更突出产品能力和实现的效果而不是基模。 基模能力的快速进步,也在吞噬一些原本属于应用层的harness能力,它要求AI视频应用要快速调整业务的工作流。 CreatOK张锦介绍,以前模型一致性能力不够,分镜的理解也不高,复杂的片段只能用首尾帧一个片段一个片段地生成,再组合。这几个月里大多场景可以一次生成了,这使得他们改变了原来的拼接工作流,把生成这个环节更多交给模型。“这是好事,让我们尽可能早的避免去做一些必定会被模型淹没的事。”张锦说。 市场快速演进之下,应用厂商的产品更新速度和频次也在加快。MovieFlow最近推出的Studio版是一个面向专业创作者推出的高阶产品线,对影视工业化流程能精细控制,支持从前期预演、分镜规划到多镜头叙事的全链路操作。梁巍告诉数智前线,目前Studio版还处于邀请码内测阶段,但后面已经等着五六个版本要发,“真的是每天都在更新。我们现在网站每天发版,恨不得上午一个版本,下午一个版本。” 这种迭代速度已成当下大模型应用创业的一个突出特点。梁巍认为,目前全社会感知到AI能力的只是一小撮人,但技术进步的奇点到来的速度前所未有地迅猛,这倒逼创业者的认知和行动都得跟上,也形成了巨大的考验,“你要能承受住这么大的节奏和压力”。 外界还观察到,基模厂商为构建闭环链路,在AI应用端的动作也不少,也有可能挤压中间层应用商的生存空间。比如字节的即梦、剪映和豆包(最近的付费会员版)都集成了Seedance2.0的核心视频生成能力,阿里的千问内也整合了Wan和HappyHorse的能力。 这考验应用平台如何在市场和基模能力之间构建差异化的产品和服务。 不过,梁巍认为,大模型再怎么持续进步,距离真正到场景用户手里,变成一个用户真正能用的产品,中间还是有缝隙的。这个缝隙可能会随着时间推移和模型能力进步而相对会越来越窄,但它将始终存在。 “我们相当于在缝里面吹气球,要把这个气球吹起来,考验的是能多快速地把气球构建起来。”他用了一个比喻,认为应用方要在技术和市场之间去找到一个平衡,然后快速行动。 张锦也坦言,纯做生成的价值会逐渐变小,模型会生成一切,但用户要的始终是交付某个场景下的结果。未来模型能力是平权的,比的是谁更好驾驭模型以及用在对的地方。“我们要做和积累的是更深刻的洞察用户场景、更多的积累公域和用户数据、让模型更方便的获得优质的用户上下文,生成能力则全部交还给模型。” happyhorse官网示例视频动图 应用服务商们看到的并非全是压力和挑战,还有一个正在打开的巨大的市场空间。 虽然随着模型进步,相对的缝隙在变小,但是整个多模态生成模型和应用构建的生态的想象空间在持续扩大。整个多模态模型的应用市场才刚刚打开,这也使得不少从业者认为,应用层还远未到你死我活的饱和竞争状态。 比如,梁巍看到,多模态能力还有望成为一种新的艺术载体,创造新的内容消费方式。他认为,今年三季度,视频多模态模型将彻底解决表演问题,AI生成的人物表演将与真人难以区分。随着多模态能力到位,除了影视制作能开拍前预演,大大提升影视工业化水平,许多从来没机会得到呈现的故事也有可能基于多模态能力而被呈现到大众面前,也会打开新的市场空间。 “漫剧可能只是模态生成能力的1%应用,另外的99%的潜力还没有真正意义上展现出来。”梁巍提到,他们从今年二季度开始在产品端快速动作之外,也在加大市场推广和营销动作。 无论是大众场景还是企业端视频制作需求以及广告制作场景,多模态模型能力渗透才刚刚开始,“AIdeo时代的诺兰、张艺谋、郭帆都还没有出现”,梁巍说。 本文来自微信公众号 “数智前线”(ID:szqx1991),作者:任晓渔,36氪经授权发布。 该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。