国产 AI 视频生成器:Wan2.6 与可灵集成 - Openclaw Skills
作者:互联网
2026-03-30
什么是 国产 AI 视频生成器?
此技能赋予开发者将行业领先的国产 AI 视频生成模型直接集成到其工作流中的能力。通过利用 Openclaw Skills,用户可以访问通义万相的 Wan2.6 模型和可灵 V2 模型,这两者都以逼真的人物动作和高清输出而闻名。该技能处理异步 API 调用、任务轮询和资产管理的复杂性,使其成为自动化内容创作的必备工具。
无论您是构建营销自动化机器人还是创意故事讲述代理,此技能都提供了生成 720P 或 1080P 视频所需的钩子。它支持高级电影级控制,并确保将最终媒体无缝交付到飞书等通信平台。
下载入口:https://github.com/openclaw/skills/tree/main/skills/dadaniya99/cn-video-gen
安装与下载
1. ClawHub CLI
从源直接安装技能的最快方式。
npx clawhub@latest install cn-video-gen
2. 手动安装
将技能文件夹复制到以下位置之一
全局模式~/.openclaw/skills/
工作区
/skills/
优先级:工作区 > 本地 > 内置
3. 提示词安装
将此提示词复制到 OpenClaw 即可自动安装。
请帮我使用 Clawhub 安装 cn-video-gen。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。
国产 AI 视频生成器 应用场景
- 根据简单的文本描述创建动态营销剪辑。
- 将静态产品摄影转换为高质量的 1080P 宣传视频。
- 自动化社交媒体多镜头叙事序列的制作。
- 使用可灵 V2 为数字分身生成逼真的人物动作和表情。
- 用户指定视频要求,包括来源(文本或图像)、时长和首选分辨率。
- 对于图生视频任务,该技能会自动将本地文件上传到公共 URL 以满足 API 要求。
- 向所选平台(通义万相或可灵)发送生成请求,启动异步任务。
- 代理进入轮询循环,定期检查任务状态(等待中、运行中或已成功)。
- 视频准备就绪后,技能会检索最终 URL,下载文件并准备分发。
国产 AI 视频生成器 配置指南
要在 Openclaw Skills 框架内使用此功能,您必须配置您的 API 凭据和环境。
# 为所需平台设置您的 API 密钥
export DASHSCOPE_API_KEY='your_aliyun_key'
export KLING_ACCESS_KEY='your_kling_access_key'
export KLING_SECRET_KEY='your_kling_secret_key'
# 对于图生视频,确保已配置图像托管
IMG_URL=$(python3 scripts/upload_image.py path/to/image.jpg | tail -1)
国产 AI 视频生成器 数据架构与分类体系
该技能通过结构化参数对象管理视频生成。
| 参数 | 描述 | 值 |
|---|---|---|
| model | 要调用的特定 AI 模型 | wan2.6-t2v, wan2.6-i2v, kling-v2-master |
| size | 输出分辨率 | 1280720, 19201080 |
| duration | 视频总长度 | 5、10 或 15 秒 |
| prompt_extend | 自动增强用户提示词 | true, false |
| shot_type | 叙事镜头风格 | single, multi |
name: cn-video-gen
description: 国产AI视频生成技能。支持通义万相(Wan2.6文生视频/图生视频)和可灵(Kling V2)。适合创意视频制作、图生视频、动态内容生成等场景。当用户要求生成视频、将图片生成动态视频、或基于描述生成视频片段时触发。
国产AI视频生成技能 ??
支持平台
| 平台 | 模型 | 适合场景 | 环境变量 |
|---|---|---|---|
| 通义万相 | wan2.6-t2v | 文字→视频 | DASHSCOPE_API_KEY |
| 通义万相 | wan2.6-i2v | 图片→视频 | DASHSCOPE_API_KEY |
| 可灵 | kling-v2-master | 文字/图片→视频(人物动作好) | KLING_ACCESS_KEY + KLING_SECRET_KEY |
工作流程
1. 确认需求
- 文生视频还是图生视频?
- 时长(5/10/15秒)
- 分辨率(720P 省钱 / 1080P 精细)
- 是否需要多镜头叙事(分镜师专用)
2. 图生视频:先上传图片到图床
如果是本地图片,必须先上传获取公网URL:
IMG_URL=$(python3 {baseDir}/scripts/upload_image.py <本地图片路径> | tail -1)
图床配置:ImgURL(uid: rrbhyq),credentials 在 TOOLS.md 中。
3. 生成视频(异步,需轮询)
调用脚本:python3 {baseDir}/scripts/generate.py
4. 下载视频并发送到飞书
生成完成后获取 video_url,下载到本地,用 feishu-send-file skill 发送。
通义万相 API
端点: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
文生视频(T2V)参数:
{
"model": "wan2.6-t2v",
"input": {
"prompt": "描述文字(中英文均可)",
"audio_url": "可选:自定义音频URL"
},
"parameters": {
"size": "1280*720",
"duration": 5,
"prompt_extend": true,
"shot_type": "single"
}
}
图生视频(I2V)参数:
{
"model": "wan2.6-i2v",
"input": {
"image_url": "图片HTTP URL(非本地路径)",
"prompt": "描述运动方式"
},
"parameters": {
"size": "1280*720",
"duration": 5
}
}
多镜头叙事(分镜师专用):
"parameters": {
"shot_type": "multi",
"prompt_extend": true
}
查询任务状态: GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
状态说明:
PENDING→ 排队中RUNNING→ 生成中(通常1-5分钟)SUCCEEDED→ 完成,取output.video_urlFAILED→ 失败,看output.message
价格参考(北京地域):
- 720P:约0.6元/秒
- 1080P:约1元/秒
- 失败任务不收费
可灵 API(Kling V2)
文档: https://klingai.kuaishou.com/api/docs
端点: https://api.klingai.com/v1/videos/text2video
认证: 需要 JWT Token(用 Access Key + Secret Key 生成)
优势: 人物动作更自然,长视频片段表现好
提示词技巧(分镜师专用)
描述运动,不只是画面
? "海边的日落" ? "镜头缓缓推进,海浪拍打礁石,夕阳的橙红色光芒在水面上跳跃"
前置主体
模型对提示词前几个词权重更高: ? "一个身穿红裙的女孩,在樱花树下旋转,花瓣飞舞"
镜头语言
- 推镜:camera slowly pushes in / 镜头缓缓推近
- 拉镜:camera pulls back / 镜头拉远
- 跟拍:tracking shot / 跟拍镜头
- 摇镜:pan left/right / 镜头向左/右摇
图生视频注意
- 图片分辨率够高(建议1280x720以上)
- 提前裁剪为目标比例(16:9 or 9:16)
- 图中有隐含动势效果更好(飘动的头发、奔跑姿势)
成本控制
- 先用5秒/720P验证 prompt
- 满意后再用10-15秒/1080P出成品
- 生成失败不收费,大胆试
- 视频 URL 有效期有限,生成后及时下载
飞书发送
生成的视频可通过 message tool 直接发送:
# 下载到本地后用 media 参数发送
message(action="send", channel="feishu", media="/path/to/video.mp4", contentType="video/mp4")
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
信号管道:自动化营销情报工具 - Openclaw Skills
技能收益追踪器:监控 Openclaw 技能并实现变现
AI 合规准备就绪度:评估与治理工具 - Openclaw Skills
FOSMVVM ServerRequest 测试生成器:自动化 API 测试 - Openclaw Skills
酒店搜索器:AI 赋能的住宿与位置情报 - Openclaw Skills
Dub 链接 API:程序化链接管理 - Openclaw Skills
IntercomSwap:P2P BTC 与 USDT 跨链兑换 - Openclaw Skills
spotplay:macOS 原生 Spotify 播放控制 - Openclaw Skills
DeepSeek OCR:AI驱动的图像文本识别 - Openclaw Skills
Web Navigator:自动化网页研究与浏览 - Openclaw Skills
AI精选
