AI 视频生成这一年最大的痛点不是”生成不出来”,是”生成出来之后改不动”。
你用 Runway、Sora、Pika 生成一段 5 秒视频,人物表情不对,背景颜色偏了,手里多了根手指——怎么办?重新生成。换个 seed,换个措辞,再等 5 分钟。出来还是不满意,再来。一个 10 秒的广告素材,迭代 8 轮不算多,光等生成就等了一小时。
这不是效率问题,是工作流问题。传统视频剪辑软件(Premiere、DaVinci)你可以逐帧调色、逐帧抠像,每一帧都是可编辑的。AI 视频生成反而倒退了——你只有一个入口(prompt),一个出口(成片),中间是黑箱。
Runway 刚发的 Aleph 2.0,尝试解决的就是这件事。
它的核心操作是:你在生成好的视频里选一帧,在这一帧上做修改(改颜色、改物体、改光影),然后它把这个修改”传播”到整段视频的其他帧上,保持运动连贯。
听起来像魔法,但实际用起来有明确的边界。
能跟住的改动:全局属性类。
你选一帧,把天空从蓝色改成橙色夕阳,它能把整段视频的天空都跟着换。你把角色衣服从白 T 改成黑夹克,后续帧里人物转身、走动,衣服颜色一致。你把画面整体色调从冷调拉暖,全片统一。
这类改动的共同特征是:改的是某个视觉属性的”值”,不是”结构”。颜色、材质、光照方向——这些东西在帧与帧之间本来就是连续变化的,模型比较容易把一帧的修改插值到其余帧。
能部分跟住的改动:物体替换类。
你在一帧里把桌上的咖啡杯换成啤酒杯,它会尝试在后续帧里保持啤酒杯。但如果原视频里有手去拿那个杯子的动作,替换后的杯子形状不同,手指和杯沿的接触关系就可能穿帮。模型能处理”杯子在那里”的空间一致性,但处理不了”手指扣住杯把”这种精细交互。
这类改动实用吗?实用,但你要挑场景。背景里的静物替换(换个花瓶、换个品牌 logo)成功率高。前景里有复杂交互的物体替换,大致率需要手动修几帧。
基本跟不住的改动:运动轨迹类。
你想让一帧里向左走的人改成向右走,或者让一个跳起来的球改成滚过去——这不是改”外观”,是改”运动本身”。Aleph 2.0 目前做不到这个。它的”传播”逻辑是在已有运动轨迹上修改视觉属性,不是重新规划运动。
这个限制很重大,由于许多人第一反应是”改一帧全片变 = 我可以随意改”。不是。你能改的是”这个东西长什么样”,不是”这个东西怎么动”。
搞清楚这个边界之后,它的实际价值就很具体了。
做广告素材的人最直接受益。一条产品广告,客户说”把包装盒颜色从红色换成蓝色”,以前要么重新拍,要么重新生成。目前选一帧改颜色,全片跟着变,客户看完说”再试试绿色”,再改一帧,又全片跟着变。一个下午能出 5 个配色版本给客户挑。
做短视频封面和动态海报的人也能用。你生成一段 3 秒循环视频当背景,觉得光影方向不对,选一帧调光,全片跟着调。以前这种微调要重新跑生成,目前是即时修改。
做动画概念视频的人可以用它快速试不同视觉风格。同一段运动,换材质、换配色、换环境光,每次改一帧就出一个新版本。比重新生成快许多,由于运动轨迹不用重算。
但要注意一件事:Aleph 2.0 目前是在 Runway 自己生成的视频上做编辑,不是对任意视频做编辑。你拿一段手机实拍的视频扔进去,它的”传播”效果会差许多,由于模型对自己生成的视频有更强的内部表明,对外部视频没有。
这意味着它目前更像是”Runway 生态内部的精修工具”,不是一个通用视频编辑器。如果你的工作流本来就在 Runway 里生成视频,Aleph 2.0 是一个实实在在的效率提升。如果你主要用实拍素材,它暂时帮不上太多。
从更大的角度看,Aleph 2.0 做的事情是把 AI 视频从”一次性生成”往”可迭代编辑”推了一步。这一步不小。过去一年 AI 视频工具竞争的焦点一直是”谁生成的画面更好看、更长、更连贯”,但实际做内容的人最头疼的从来不是第一版不够好看,而是改不动。能改,哪怕只能改一部分,工作流就从”抽卡”变成了”雕刻”。
这个方向如果继续推下去——未来能改运动轨迹、能对实拍视频做同样的操作——视频编辑这件事的操作方式会真正变掉。但那是后来的事。目前的 Aleph 2.0,能做的是全局视觉属性的单帧编辑 + 全片传播,这个能力已经值得做广告、做短视频、做动画概念的人去试一下,看看能不能省掉每天那几十次”不满意,重新生成”。



