概览
Vidu 2 视频生成大模型,平衡速度与质量,主攻图生视频、首尾帧功能,支持 4 秒时长下 720P 分辨率输出。生成速度大幅提升,成本显著降低;图生视频修复变色问题,画面稳定可控适配电商等场景,首尾帧语义理解与多参考图一致性增强,成为泛娱乐、互联网、动漫短剧、广告量产的高效工具。
- vidu2-image
- vidu2-start-end
- vidu2-reference
能力
图生视频
时长
4s
清晰度
720P
价格
1.25 元 / 次
能力说明
图生视频
输入首帧图片以及对应的文本描述,生成视频。
首尾帧
支持输入两张图,上传的第一张图片视作首帧图,第二张图片视作尾帧图,模型将以此参数中传入的图片来生成视频。
参考生视频
输入参考图图片和文本描述,生成视频。目前已支持参考人物、物品等多类主体。
模型生成的视频 url 链接有效期为1天,如有需要请尽快转存。
推荐场景
泛娱乐内容生成
泛娱乐内容生成
- 输入单帧画面或 IP 元素,快速生成剧情连贯的短视频、互动特效素材
- 支持从二次元萌系到写实风格的多元视觉呈现
- 适配短视频平台 UGC 创意内容量产需求
动漫短剧制作
动漫短剧制作
- 输入静态角色图片或首尾帧,输出流畅动态动画与微短剧
- 精准还原角色动作细节(如表情变化)
- 支持国漫、日漫等多风格量产
- 满足动画工作室 IP 衍生开发
广告电商营销
广告电商营销
- 输入产品实拍图,智能生成动态广告视频
- 清晰呈现 3C 产品细节、美妆产品质地等商品特性
- 自动适配抖音竖屏、朋友圈横屏等多平台尺寸
使用资源
接口文档:API 调用方式
详细介绍
1
高效的视频生成速度
模型算力架构优化,视频渲染效率显著提升。对于日更团队,可快速响应热点选题;电商商家批量制作商品展示素材时,也能实现“即需即产”,大幅压缩内容交付周期,助力创作者抓住流量时效窗口。
2
高性价比的 720P 输出
720P 分辨率视频成本降至 Q1 版本的 40% 。中小品牌可批量生成多 SKU 展示视频,广告团队也能低成本测试“产品特写+场景演绎”等创意方向,以更低预算覆盖全平台营销素材需求,突破内容生产的成本壁垒。
3
稳定可控的图生视频能力
修复“材质变色”问题,如服装类图生视频中,真丝面料的柔光反射、皮革的哑光质感可精准还原,电商场景下商品色彩展示更真实;优化动态帧补偿,3C 产品旋转演示、美妆教程手部动作时,镜头无抖动、动作无偏移;同时支持多种风格,生成“产品特写+风格化运镜”的吸睛素材,适配电商主图、短视频带货等场景。
4
语义增强的首尾帧衔接
模型兼顾想象力与稳定性,效果全面提升,语义理解能力显著增强,为当前最优首尾帧生成方案。通过精准解析场景逻辑与动作关联,镜头切换自然流畅,有效提升内容叙事连贯性。
5
多参考图的一致性强化
输入多元素素材时,生成视频的视觉风格(如色调、光影)可高度统一 。例如文旅宣传片中,古城日出、街市场景、民俗表演的画面切换,始终保持“国风滤镜”一致性;动漫 IP 衍生内容里,角色在不同剧情场景的动作、表情,也能严格贴合原设定,助力多场景、多元素内容的连贯创作。

调用示例
图生视频
- cURL
- Python
- Java
- Python(旧)
首尾帧
- cURL
- Python
参考生视频
- cURL
- python
用户并发权益
API 调用会受到速率限制,当前我们限制的维度是请求并发数量(在途请求任务数量)。不同等级的用户并发保障如下:
V0 | V1 | V2 | V3 |
---|---|---|---|
5 | 10 | 15 | 20 |