如何使用 Kensa 的参考视频生成工具
详细教程:如何使用参考视频引导 AI 生成全新视频。了解何时以及如何使用参考视频功能,获得更可控、更可预测的生成效果。
快速步骤
上传参考视频
选择一段能展示你想要的运动风格、镜头运动或视觉美学的视频片段。支持 MP4、MOV 和 WebM 格式。参考片段建议保持在 5-15 秒以内,以获得最佳效果。
编写描述性提示词
添加文本提示词,描述你希望最终视频呈现的内容。AI 会将参考视频的风格和运动与你的文字描述相结合。例如:'夕阳下的未来城市景观,飞行汽车穿梭其中,保持与参考视频相同的平滑推轨运动。'
选择模型并配置设置
选择一个支持参考视频生成的 AI 模型。配置输出时长、宽高比和画质设置。将宽高比与参考视频保持一致,可获得最协调的生成结果。
生成、预览并下载
点击'生成'开始处理。AI 会分析参考视频的运动模式、节奏和风格,然后结合你的提示词生成全新视频。预览输出效果,满意后下载,或根据需要重新生成。
如何使用 Kensa 的参考视频生成工具
参考视频生成是 Kensa 上最强大的功能之一。无需在文本提示词中描述运动、镜头和节奏的每一个细节,你只需上传一段现有视频片段作为参考,让 AI 从中学习。本指南将带你完成从选择合适的参考视频到下载最终成品的完整流程。
什么是参考视频生成?
参考视频生成(有时也称为视频到视频或风格迁移)是一种 AI 生成模式,你提供一段现有视频片段作为引导参考。AI 会分析参考视频的以下特征:
- 镜头运动 — 平移、倾斜、推轨、跟踪拍摄或静态构图
- 运动节奏 — 缓慢而富有电影感、快速而充满活力,或介于两者之间
- 视觉风格 — 调色风格、光照氛围、对比度
- 场景构图 — 主体如何布局、画面如何随时间演变
AI 随后生成一段全新的视频,遵循从参考中学到的运动模式,同时融入你在文本提示词中描述的主题和场景内容。
什么时候该用参考视频生成?
参考视频生成并非总是最佳选择。以下对比表可以帮助你判断哪种工具最适合你的项目:
| 生成模式 | 最适合场景 | 所需输入 |
|---|---|---|
| 文生视频 | 快速创意探索、简单场景 | 仅需文本提示词 |
| 图生视频 | 为特定静态图片添加动画 | 图片 + 文本提示词 |
| 参考视频生成 | 复刻特定的运动风格或镜头技术 | 视频片段 + 文本提示词 |
以下情况适合使用参考视频生成:
- 你有一个特定的镜头运动想要复刻(例如平滑的无人机俯拍)
- 你需要在一系列视频中保持一致的运动节奏(例如品牌视频系列)
- 你想匹配现有片段的"感觉",但使用完全不同的主题内容
- 你正在基于现有概念创建变体,并希望风格高度一致
以下情况建议使用文生视频或图生视频:
- 手边没有可用的参考片段
- 希望 AI 完全自由发挥创意,不受运动约束
- 需要为一张特定的静态图片添加动画
前提条件
- 一个 Kensa 账户(可免费注册)
- 账户中有积分(新用户获赠免费积分)
- 设备上有一段参考视频片段(MP4、MOV 或 WebM 格式)
详细步骤
第一步:上传参考视频
进入 Kensa 的参考视频生成工具页面。你会看到一个上传区域,可以拖放文件或点击浏览来选择参考视频。
参考片段的关键要求:
- 时长:保持在 5 到 15 秒之间。较长的片段会被自动裁剪,但较短的片段能给 AI 提供更清晰的信号。
- 分辨率:建议至少 720p。更高分辨率的参考片段有助于 AI 理解细节。
- 稳定性:如果你想要稳定的输出效果,请使用稳定的参考片段。手持拍摄的抖动画面会导致输出也出现抖动。
- 简洁性:单个连续镜头的效果优于包含多个剪辑的片段。AI 会分析整段视频的运动,突兀的转场可能干扰分析。
上传完成后,你会看到视频缩略图预览和基本信息(时长、分辨率、文件大小)。在继续之前,确认加载的是正确的文件。
第二步:编写描述性提示词
在上传区域下方,你会找到文本提示词输入框。在这里描述你想要生成的视频内容。AI 使用参考视频提供风格和运动引导,使用你的提示词确定实际的画面内容。
搭配参考视频编写有效提示词的技巧:
- 专注描述主体和场景,而非镜头运动。参考视频已经提供了运动信息,因此提示词应该描述画面中出现的内容。
- 对视觉细节要具体:提及颜色、光照、时间段、环境和氛围。
- 加入风格关键词可以进一步推动美学方向。例如"电影感""纪录片风格""霓虹灯光""柔和粉彩色调"等词汇可以引导最终效果。
- 说明与参考的不同之处。例如:"与参考视频相同的平滑跟踪镜头,但场景设置在雪山景观而非城市环境中。"
示例提示词:
一只雄鹰在黄金时段翱翔于广阔峡谷上空,背景是壮观的云层,电影级调色,温暖的琥珀色调。镜头跟随与参考视频相同的弧形运动轨迹。
第三步:选择模型并配置设置
输入提示词后,从模型选择器中选择一个 AI 模型。不同模型对参考视频的支持程度不同,以下是详细对比:
| 模型 | 参考支持 | 时长范围 | 推荐用途 |
|---|---|---|---|
| Sora 2 | 完整支持 | 10-15秒 | 电影级参考匹配 |
| Wan 2.6 | 完整支持 | 5-15秒 | 通用参考使用 |
| Seedance 1.5 Pro | 部分支持 | 5-10秒 | 运动风格迁移 |
需要配置的设置:
- 时长:选择输出视频的长度。为了最接近参考效果,建议将输出时长设置为与参考片段相同。
- 宽高比:使用与参考视频相同的宽高比。16:9 的参考搭配 9:16 的输出会产生不协调的构图。
- 画质:标准画质适合草稿预览。当你对创意方向满意后,可以切换到高画质或 1080P 来生成最终版本。
第四步:生成、预览并下载
点击生成按钮开始处理。以下是后台发生的过程:
- AI 逐帧分析你的参考视频,提取运动向量、镜头路径数据和风格特征。
- 将这些运动蓝图与你的文本提示词相结合,规划新视频的内容。
- 视频逐步生成,根据模型和时长不同,通常需要 3-7 分钟。
- 完成后,视频会出现在你的生成队列中,状态显示为已完成。
检查生成结果:
- 播放生成的视频,与参考视频进行对比。
- 检查镜头运动是否符合预期。
- 观察节奏 — 运动的速度和韵律感觉是否合适?
- 评估画面内容 — 场景是否与提示词描述一致?
如果结果不太理想,你可以:
- 调整提示词,对被遗漏的元素进行更具体的描述。
- 尝试不同的模型 — 每个模型对参考视频的理解方式略有不同。
- 使用参考片段的不同部分,尤其是当原始片段包含多种运动风格时。
当你满意时,点击下载将视频保存到你的设备。你也可以在仪表板的视频标签下找到所有生成的视频。
如何选择好的参考视频
参考视频的质量直接影响输出质量。遵循以下准则可获得最佳效果:
- 单个连续镜头:避免包含跳切或场景转换的片段。一个不间断的镜头运动能给 AI 最清晰的指令。
- 一致的运动:平滑、稳定的平移比不规则、不可预测的运动更容易被 AI 学习。如果你需要动感十足的画面,确保参考片段全程都保持这种有意为之的动感。
- 良好的光照:光线充足的参考画面能产生更可预测的风格迁移效果。光线昏暗或不均匀的片段可能导致输出出现意外的明暗变化。
- 避免文字和叠加层:避免使用带有水印、字幕或屏幕图形的参考片段。AI 可能会尝试复制这些元素。
- 合适的长度:5-10 秒是最佳范围。过短的片段(不到 3 秒)无法提供足够的运动数据。过长的片段(超过 20 秒)可能会稀释信号。
- 匹配你的意图:如果你想要缓慢的电影感,就使用缓慢的电影感参考。如果你想要快节奏的动作,就使用充满活力的参考。AI 会镜像它所看到的内容。
常见使用场景
- 品牌视频系列:上传一段品牌视频作为参考,然后生成多个变体,使用不同的产品或信息,但保持相同的视觉风格。
- 社交媒体内容:使用一种流行的视频风格作为参考,创作与当前审美匹配的原创内容,而不是复制原始视频。
- 分镜预可视化:用手机录制粗略的镜头运动,然后将其作为参考,生成经过 AI 增强的精美版本。
- 风格探索:以你欣赏的电影或广告中的片段为参考,生成具有相同视觉语言的全新场景。
常见问题排查
| 问题 | 可能原因 | 解决方案 |
|---|---|---|
| 输出运动与参考不匹配 | 参考片段包含多个剪辑 | 使用单个连续镜头 |
| 输出画面模糊 | 参考分辨率低或画质设置低 | 使用更高分辨率的参考并将画质设为高 |
| AI 忽略提示词内容 | 提示词与参考风格冲突 | 简化提示词或选择更中性的参考 |
| 生成时间过长 | 高分辨率输出加长时长 | 降低时长或画质以加快草稿生成 |
立即尝试
准备好用你自己的参考片段来引导 AI 创作了吗?前往参考视频生成工具,体验风格引导 AI 生成的精准效果。