视频生成|Runway是一个通用视频生成及编辑工具

最近发现文生视频的工具大家总会提Runway,激发了我对Runway多模态产品的探索欲,决定分析一下这款工具。

分析后,我突然想明白了,总会被问到:你是如何生成用户想要的东西?在我的视角,通过prompt和微调就解决了,因为我也是这么做和设计产品的。当我看到Runaway这个产品的时候,对方可能是在说这类通用型的AI Native产品工具


AI视角结论:

我们离AGI还很远...现阶段重点考虑怎么把AI工具用在实际业务的工作流程,不管是嵌进去还是单独部署。

当一个产品只是解决中间某一个环节的降本问题,比如优化了编辑环节,那么我认为后面会有更能降本增效的产品出现,比如直接制作,直接影响整个工作流环节。

具体Runway的产品测评、细节体验总结:

1)短视频,单个镜头效果不错,prompt建议用英文。更适合专业的视频剪辑师使用。生成效果还是很好的,作为视频生成和编辑工具,基本功能还是有的,总体体验下来,简单的场景大家还是可以使用的,是一个好的工具。

2)没有明确使用场景,是一个通用工具。那么用户需要自己了解视频的因素有哪些,比如风格等。想要什么场景,场景里有什么东西,全靠用户写提示词,如果用户不会写提示词怎么办?写的提示词不是自己想要的。第一步的基础上做可视化,设置明确的场景,确定风格,比如综艺、短视频等,甚至再细分,使用户生成的视频更准。

3)只是一个基础功能,缺少很多基于行业knowhow的差异化功能,比如在制作视频中,要去水印,那么只需要输入去水印提示词或者点击一下按钮,就可以完成。综艺行业的去水印,就知道要突出产品的重点,去掉其他不重要的信息。

4)不同风格下,视频里的细节需要优化

下面来详细分析一下:

一、产品所属行业

内容创作-视频创作

Runway Gen-2 是一款强大的AI视频制作工具,它通过将文本转化为视觉内容,为用户提供了一种全新的表达方式,并在广告制作、品牌宣传、游戏开发等领域具有广泛的应用前景。

Runway 的产品哲学很清晰:一直站在 AI 技术演进的前沿,始终基于 AI 新技术的边界,寻找视频和图像编辑的全新方法。他们不希望做一个更好的 Photoshop 或 Premiere,而是希望借助云计算和 AI 的力量塑造全新的工作流。

二、产业链、业务流

视频创作和编辑的整个产业链涉及多个环节和众多参与者,构成了一个复杂的生态系统。以下是视频创作和编辑产业链的上下游主要参与者和工作流程的概述:

1.产业链上游:

创意开发与策划:包括编剧、导演和制片人,他们负责构思故事、制定拍摄计划和预算。

资金筹集:投资者、电影公司或众筹平台,为项目提供必要的资金支持。

选角与演员管理:选角导演负责挑选合适的演员,管理演员的合同和日程。

场地与设备租赁:提供拍摄所需的场地和设备,如摄影棚、摄像机、灯光等。

2.产业链中游:

拍摄制作:导演、摄影师、灯光师、美术指导等专业人员,负责实际的拍摄工作。

后期制作

  剪辑:剪辑师负责将拍摄的素材剪辑成连贯的故事,包括初剪和精剪。

  视觉特效:特效师使用专业软件添加视觉效果。

  音频制作:包括配音、音效和音乐制作。

  调色:调色师调整影片的色调和风格。

审查与修改:根据反馈进行必要的修改和调整。

3.产业链下游:

发行与销售:发行商负责将作品推广到市场,包括电影院、电视台、网络平台等。

营销与宣传:营销团队负责宣传推广,吸引观众关注和观看。

版权管理:处理作品的版权问题,包括授权和保护。

观众:最终的消费者,观看并评价作品。

这里先以电视栏目为传播渠道、其实还有电商平台、短视频等平台。可以看出视频生成属于产业链的中游,主要在后期制作部分。

那么视频生成工具主要应用于后期制作部分,因为视频生成只需要输入prompt,那么其实真正的用户是专业点的流程需要用AIGC视频设计师来编辑视频,当然导演、商家、自媒体人也可以直接生成视频。

三、产品用户画像

Runway产品更适用于后期制作师。

后期制作师:

用户画像高度专业的技术技能,熟悉各种视频编辑软件和后期制作工具。

用户痛点时间压力:在紧迫的截止日期下完成高质量的工作。技术限制:受限于当前软件和硬件的性能,可能无法实现创意愿景。素材管理:需要有效管理和快速访问大量视频素材。

补充下视频编辑流程及必备要素,便于我们后面分析产品:

后期制作是视频制作流程中非常关键的一步,它涉及到将拍摄的原始素材转换成一个连贯、有吸引力的故事。后期制作的具体步骤可能因项目而异,但通常包括以下几个阶段:

  1. 素材导入与管理:将拍摄的原始视频素材导入到计算机中。对素材进行分类和标记,以便快速查找。

  2. 剪辑初剪:根据剧本和拍摄计划,剪掉不需要的部分,形成初步的故事线。精剪:进一步细化剪辑,调整节奏,确保故事连贯。

  3. 调色:调整视频的色彩,使其风格统一,增强视觉效果。

  4. 视觉特效(VFX):添加或修饰画面中的元素,如移除穿帮镜头、添加CGI(计算机生成图像)等。

  5. 音频编辑:调整和混合对话、音效和音乐,确保音频清晰且与画面同步。

  6. 配音:如果需要,录制或编辑旁白、解说词等。

  7. 音效设计:添加或编辑环境声、动作声等,增强场景的真实感。

  8. 音乐配乐:选择合适的背景音乐,增强情感表达。

  9. 字幕和图形:添加字幕、标题、图表、动画等视觉元素。

  10. 合成:将所有元素(视频、音频、特效、字幕)合成为最终的视频。

四、产品形态分析

1)产品定位:

视频生成、通用世界模型。

因为视频生成的平台不多,我这里先说下与文生图平台的区别:

与SD最大的不同点、底模是通用模型,不可选其他底模,也不能加lora微调,导致生成不准。可能因为这个是生成视频的软件?

使用过即刻设计的文生图,是有具体的使用场景,虽然不多,但图片能看也能用。操作也很简单,输入文字或图片,选择场景,直接输出图片,降低用户教育成本。这种形式是我很想做的,现在很多的产品,用户教育成本太高了。

像Runway、SD,我之前看的coze这种工作台(需要用户自己动手微调部署、自己搭建Agent的产品)。正如上面所说,真正的用户是专业人士。

2)产品功能:

一般业务只需要一键生成即可,Runway主要是视频/图片生成,编辑两大部分。更建议直接把编辑功能直接放入生成功能后,可以理解为也是通过编辑后生成的图片(此处不易理解),否则会让整个产品看起来很乱,甚至当前设计很多编辑功能的信息展示不全面。

2.1)文本/图像转视频:

使用文本到视频生成功能创建您可以想象的任何风格的视频。如果你能想象它,你就能生成它。(这几个功能影响,比如选风格,需要先选风格,再传照片,先传照片则改不了风格。所以在这里最后传照片比较好)

使用步骤:

1)输入文字提示:想象一个原始文本提示,或者开始编写一个并从我们的自动提示建议中获得灵感。

2)调整设置:使用网页上的高级设置来微调生成。为后代保存种子数,启用升级以增强视频分辨率,或使用插值来平滑帧。

常规设置:插值来平滑帧、增强分辨率、去水印、种子

相机运动:指定摄像机的移动和强度,就像您在拍摄一样。水平、旋转、前后倾斜、左右倾斜、垂直、飞涨

通用运动:增加或减少视频中的运动强度。值越高,运动越多。

运动画笔:

自定义模型(您的输出将与您的图像风格相匹配。要使用自定义模型,请删除您的图像)。训练的自己的模型

风格:(在这能看到风格了,下拉列表是看不到的)

横纵比

3)生产:单击“生成此”以生成您的定制 Gen-2 创建。从这里,将各版下载到您的计算机,或将它们保存在您的 Runway 资产中以供以后使用。

存在问题:

1)从这里可以看出,没有明确使用场景,就是一个通用工具。

2)只是一个基础功能,缺少很多基于行业knowhow的差异化功能,比如在制作视频中,要去水印,电商行业的去水印,就知道要突出产品的重点,去掉其他不重要的信息。

2.2)视频到视频

使用文字和图像从现有视频中生成新视频。

使用步骤:

1)选择视频:从桌面或 iPhone 中选择要用作输入的视频。如果您使用的是移动设备,您还可以选择直接在应用程序中拍摄新视频。

2)选择您的风格参考:可以通过三种方法来转换输入视频。选择现有图像、编写文本提示或从 Runway 的预设样式之一中进行选择。

3)预览并生成:解锁高级设置,例如结构一致性、重量或框架一致性,以微调您的生成。在提交之前预览各个版本。然后,只需单击“生成”即可观看魔术的展开。

风格:结构一致性,值越高,输出的结构与输入视频的差异越大。推荐:0 到 5。

权重:值越高,越强调匹配风格而不是输入视频。建议:7.5 至 12.5。

种子

帧一致性:低于 1 的值会降低随时间的一致性;高于 1 的值会增加帧与先前帧的相关程度。建议:1.0 至 1.25。

自动增强图像分辨率(可能会稍微增加生成时间)。

去除水印

仅影响前景:只会影响前景主体,而背景不受影响

仅影响背景:只会影响背景而不会影响前景主体。

预览、生成

2.3)人物模型训练(训练lora模型可视化了,等于把这步让用户自己完成了,学习人物特征)

轻松训练您自己的 AI 图像生成器,以实现无尽的定制肖像、动物及风格等

1)上传图片:

选择 15-25 张图像来创建数据集。模型的结果将直接受到您上传的图片的影响,所以请谨慎选择!确保您的主题清晰,提供不同的背景和照明情况,并裁剪图像以仅包含主题。

2)训练

为您的模型提供一个名字——使其简单易记,以便将来使用。等待大约 30 分钟以处理训练结果。

3)生成模型

通过打开“文本到图像”并在其中选择您的模型,探索自定义图像的新方法。(将其视为您的个人人工智能艺术生成器!)

2.4)文本到图像生成

通过输入描述性文本,使用我们的 AI 图像生成器轻松从头开始创建图像。

1)写一个提示:发挥你的想象力来制作一行原创文字。为了获得最佳结果,您需要提供尽可能多的细节 - 逗号是您的朋友!——还是写提示词的问题。

2)调整设置:

基础设置:更改比例(长宽比)像素(720P、4K)、风格(3D卡通、3D渲染、蒸汽波、广告、日本动画片、建筑、雕像、电影镜头等)、输出数量(1、2等)

高级设置:提示权重((也称为无分类器指导)确定在生成过程中考虑多少提示。较高的值可能会产生更精确的结果,而较低的值可能会产生更有创意的输出。)种子(噪声)、负面提示(不能出现什么)\媒介、情绪,以根据您的喜好自定义文本到图像 AI。想想:像素艺术、水彩画、生动、素描以及更多风格(这里的设计做的很好)

3)生成:选择完所有设置后,请选择要生成的图像数量 - 从一张图像到一批 500 张图像。

建议提示词用英文,中文识别效果不太好。

2.5)图生图

使用我们的 AI 图像生成器从文本轻松将现有图像转换为修改后的图像。(其实我之前不是很理解SD的图生图,现在基本理解了)

1)选择图像:上传您想要修改或转换的图像。您将能够调整图像的风格,调整主题,或创建新的情绪,但原始图像是魔术工具将要处理的内容。

2)提示词:描述图像,包括您想要进行的任何调整或编辑

像素、输出数量、种子、风格(与文生图一样)、提示权重(较低的提示权重将产生更有创意的结果,而较高的提示权重将更紧密地遵循您的文本提示。)、力量( 控制原始图像结构的变换程度。)、负面提示。

3)生成:使用高级设置进行进一步的优化,选择所需的输出数量,然后借助我们的 AI 图像生成器轻松生成新图像!

2.6)编辑图片(这个功能指看到的独立于生成功能的编辑图片功能)
1)图片扩展:通过描述性文本提示生成上下文感知元素,无缝扩展现有图像。
2)插值(做动图用):
使用 AI 帧插值轻松自动在上传的图像之间生成平滑的过渡,以创建流畅的视频结果。
  1)选择图像:选择一系列图像。相似的图像将产生更真实的结果,而广泛变化的图像将产生更具实验性和创造性的结果。
  2)调整:选择每个图像最多 10 秒的剪辑持续时间以及首选过渡时间百分比。
  3)生成:选择设置后,只需单击“生成”。生成视频后,使用调整滑块微调结果或返回并编辑选定的图像。
3)擦除、替换:重新想象和混合任何图像的任何部分
4)背景混音:为图片提供背景
5)图像变化:为图像生成其他多个相同的物体,不同的图片
6)给图片加颜色
7)高分辨率图像:给图像加高分辨率
看到一个专业的商业广告师,生成视频一共使用了4款AI工具。整个工作流主要如下:
1、 用Midjourney生成图片;
2、 用Runway生成视频;
3、 用Pika Labs完成剪辑;
4、 用Topaz提升图像的清晰度。
思考:为什么没有一款能满足全流程软件?

五、产品技术原理

  1. 深度学习神经网络:Runway使用深度学习算法,特别是卷积神经网络(CNNs),来处理和分析视觉数据。这些算法可以识别图像中的模式,并用于各种视频编辑任务。
  2. 生成对抗网络GANs:GANs是一种特别适合生成视觉内容的深度学习模型,由两个相互竞争的网络组成:生成器和判别器。生成器创建新的数据实例,而判别器评估它们是否真实。这种对抗过程可以生成高度逼真的图像或视频。
  3. 变分自编码器(VAEs):VAEs是一种生成模型,能够学习输入数据的压缩表示,并能从该表示中生成新的数据实例。它们常用于生成视频和图像
  4. 自注意力机制(Transformer):Transformer架构是一种处理序列数据的模型,特别适合于视频内容的生成,因为它能够捕捉视频帧之间的长期依赖关系。
具体技术解释,可以看我的这篇文章:从AI原生产品角度分析基于Transformer架构视频生成模型:Sora扩散模型

六、商业模式

Runway的商业模式主要围绕其开发的先进人工智能算法,专注于创意内容的生成,包括书面、视觉和音频内容。以下是Runway商业模式的关键要素:
  1. 产品开发:Runway提供AI驱动的创意工具,这些工具通过用户友好的平台提供,强调可访问性和易用性。
  2. 市场定位:Runway定位于艺术家、视频编辑、电影制作人以及广泛的内容创作者市场,旨在降低视频制作和编辑的技术门槛。
  3. 技术创新:Runway利用最新的计算机图形学和机器学习技术,提供从文本到视频的转换能力,以及其他视频编辑功能,如图像修复、绿幕修图和运动跟踪。
  4. 风险投资:Runway通过多轮融资吸引了包括谷歌、英伟达、Salesforce Venture和Rogue VC在内的投资者,累计融资达1.41亿美元。
  5. 合作伙伴关系:Runway与包括Adobe、Facebook、Google、Netflix和The New York Times在内的知名品牌和机构建立了合作关系。
  6. 云计算协议:Runway与亚马逊和谷歌等大型云服务提供商签订了重要的云计算协议,这表明了其在云服务领域的战略布局。
  7. 社区和协作:Runway鼓励用户社区的参与和反馈,以促进产品的迭代和改进,同时提供协作工具以支持团队合作。
  8. 商业模式:Runway采用了Freemium模式,提供免费和付费版本,允许用户在一定限制内免费使用其工具,同时也提供付费订阅以解锁更多功能和高级服务。
  9. 市场教育:鉴于Runway提供的是一种新技术,公司需要投资于市场教育,帮助潜在用户理解AI在视频编辑和内容创作中的潜力和应用。
  10. 持续创新:Runway持续推动AI技术在创意领域的应用,通过不断研发和推出新工具来维持其在行业中的领先地位。
盈利方式:
1.Freemium模型:Runway提供免费的基础版本,让用户可以体验其AI工具的基本功能。这种模式降低了新用户的入门门槛,同时展示了产品的潜力。
2.订阅服务:除了免费版本,Runway还提供付费订阅服务,用户支付月费或年费以获取更高级的功能和更优质的服务。
3.企业解决方案:对于专业团队和企业用户,Runway可能提供定制化的解决方案,包括专属功能、优先支持和更高级的集成服务。
4.按需付费:某些高级功能或额外的计算资源可能采用按需付费的方式,用户根据自己的具体使用量支付费用。
建议:
1.分层定价:Runway可能采用分层定价策略,不同的订阅层级提供不同范围的功能和资源。这种方式允许用户根据自己的需求和预算选择合适的服务。
2.教育和非营利折扣:Runway可能会为教育用户和非营利组织提供折扣,以支持这些群体的创意项目。
其他运营及推广:
  1. 运营营销方式(用户留存转化、推荐)
    1. 个性化体验:Runway 注重提供个性化的用户界面和体验,通过客户数据来定制服务,从而提高用户满意度和留存率。
    2. 社区和协作:Runway 鼓励用户参与社区活动,通过社区驱动的方式提高用户粘性,同时提供协作工具以支持团队合作,这有助于用户留存和口碑传播。
    3. 推荐计划:Runway 采用推荐计划来激励现有用户推荐新用户,通过提供双方都受益的奖励机制来促进用户增长。
    4. 客户反馈:Runway 通过监控网站和社交平台上的活动,实时解决问题,提供个性化服务和交流,增强客户忠诚度。
    5. 订阅服务:Runway 提供基于订阅的服务模式,为用户提供可靠的收入来源,同时保证用户对服务的持续性使用。
  2. 推广渠道(用户激活)
    1. 社交媒体:Runway 利用社交媒体平台,如 Facebook 和 Instagram,与客户进行互动,并通过客户的社交分享进行口碑宣传。
    2. 内容营销:通过发布教程、案例研究和博客文章等内容,Runway 教育潜在用户并展示其产品的功能性和价值。
    3. 合作伙伴关系:与设计师和品牌建立合作,通过合作伙伴的网络进行产品推广,同时为设计师提供市场反馈和数据支持。
    4. 搜索引擎优化SEO:通过优化网站内容和结构,提高在搜索引擎中的可见度,吸引更多自然流量。
    5. 行业活动:参与行业会议和活动,提高品牌知名度,并通过现场互动和演示吸引潜在用户。
    6. 用户生成内容:鼓励用户分享使用 Runway 制作的内容,利用用户生成的内容作为推广材料,增加新用户的好奇心和参与度。

七、参考资料

AI 视频:文本生视频工具Runway Gen-2的强大功能与...:https://cloud.baidu.com/article/3182248

估值暴涨3倍,《瞬息全宇宙》幕后公司Runway...:https://new.qq.com/rain/a/20230615A0380S00
Runway:AI Native Tools工厂,视频生成领域的字节跳动:https://www.36kr.com/p/2184735652004739
深度体验自动生成视频的AI工具Runway:https://zhuanlan.zhihu.com/p/682096306
... ...

本文由“公众号文章抓取器”生成,请忽略上文所有联系方式或指引式信息。有问题可以联系:五人工作室,官网:www.Wuren.Work,QQ微信同号1976.424.585