国产 AI 视频生成器:Wan2.6 与可灵集成 - Openclaw Skills

作者:互联网

2026-03-30

AI教程

什么是 国产 AI 视频生成器?

此技能赋予开发者将行业领先的国产 AI 视频生成模型直接集成到其工作流中的能力。通过利用 Openclaw Skills,用户可以访问通义万相的 Wan2.6 模型和可灵 V2 模型,这两者都以逼真的人物动作和高清输出而闻名。该技能处理异步 API 调用、任务轮询和资产管理的复杂性,使其成为自动化内容创作的必备工具。

无论您是构建营销自动化机器人还是创意故事讲述代理,此技能都提供了生成 720P 或 1080P 视频所需的钩子。它支持高级电影级控制,并确保将最终媒体无缝交付到飞书等通信平台。

下载入口:https://github.com/openclaw/skills/tree/main/skills/dadaniya99/cn-video-gen

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install cn-video-gen

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级:工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 cn-video-gen。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。

国产 AI 视频生成器 应用场景

  • 根据简单的文本描述创建动态营销剪辑。
  • 将静态产品摄影转换为高质量的 1080P 宣传视频。
  • 自动化社交媒体多镜头叙事序列的制作。
  • 使用可灵 V2 为数字分身生成逼真的人物动作和表情。
国产 AI 视频生成器 工作原理
  1. 用户指定视频要求,包括来源(文本或图像)、时长和首选分辨率。
  2. 对于图生视频任务,该技能会自动将本地文件上传到公共 URL 以满足 API 要求。
  3. 向所选平台(通义万相或可灵)发送生成请求,启动异步任务。
  4. 代理进入轮询循环,定期检查任务状态(等待中、运行中或已成功)。
  5. 视频准备就绪后,技能会检索最终 URL,下载文件并准备分发。

国产 AI 视频生成器 配置指南

要在 Openclaw Skills 框架内使用此功能,您必须配置您的 API 凭据和环境。

# 为所需平台设置您的 API 密钥
export DASHSCOPE_API_KEY='your_aliyun_key'
export KLING_ACCESS_KEY='your_kling_access_key'
export KLING_SECRET_KEY='your_kling_secret_key'

# 对于图生视频,确保已配置图像托管
IMG_URL=$(python3 scripts/upload_image.py path/to/image.jpg | tail -1)

国产 AI 视频生成器 数据架构与分类体系

该技能通过结构化参数对象管理视频生成。

参数 描述
model 要调用的特定 AI 模型 wan2.6-t2v, wan2.6-i2v, kling-v2-master
size 输出分辨率 1280720, 19201080
duration 视频总长度 5、10 或 15 秒
prompt_extend 自动增强用户提示词 true, false
shot_type 叙事镜头风格 single, multi
name: cn-video-gen
description: 国产AI视频生成技能。支持通义万相(Wan2.6文生视频/图生视频)和可灵(Kling V2)。适合创意视频制作、图生视频、动态内容生成等场景。当用户要求生成视频、将图片生成动态视频、或基于描述生成视频片段时触发。

国产AI视频生成技能 ??

支持平台

平台 模型 适合场景 环境变量
通义万相 wan2.6-t2v 文字→视频 DASHSCOPE_API_KEY
通义万相 wan2.6-i2v 图片→视频 DASHSCOPE_API_KEY
可灵 kling-v2-master 文字/图片→视频(人物动作好) KLING_ACCESS_KEY + KLING_SECRET_KEY

工作流程

1. 确认需求

  • 文生视频还是图生视频?
  • 时长(5/10/15秒)
  • 分辨率(720P 省钱 / 1080P 精细)
  • 是否需要多镜头叙事(分镜师专用)

2. 图生视频:先上传图片到图床

如果是本地图片,必须先上传获取公网URL:

IMG_URL=$(python3 {baseDir}/scripts/upload_image.py <本地图片路径> | tail -1)

图床配置:ImgURL(uid: rrbhyq),credentials 在 TOOLS.md 中。

3. 生成视频(异步,需轮询)

调用脚本:python3 {baseDir}/scripts/generate.py

4. 下载视频并发送到飞书

生成完成后获取 video_url,下载到本地,用 feishu-send-file skill 发送。

通义万相 API

端点: https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

文生视频(T2V)参数:

{
  "model": "wan2.6-t2v",
  "input": {
    "prompt": "描述文字(中英文均可)",
    "audio_url": "可选:自定义音频URL"
  },
  "parameters": {
    "size": "1280*720",
    "duration": 5,
    "prompt_extend": true,
    "shot_type": "single"
  }
}

图生视频(I2V)参数:

{
  "model": "wan2.6-i2v",
  "input": {
    "image_url": "图片HTTP URL(非本地路径)",
    "prompt": "描述运动方式"
  },
  "parameters": {
    "size": "1280*720",
    "duration": 5
  }
}

多镜头叙事(分镜师专用):

"parameters": {
  "shot_type": "multi",
  "prompt_extend": true
}

查询任务状态: GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

状态说明:

  • PENDING → 排队中
  • RUNNING → 生成中(通常1-5分钟)
  • SUCCEEDED → 完成,取 output.video_url
  • FAILED → 失败,看 output.message

价格参考(北京地域):

  • 720P:约0.6元/秒
  • 1080P:约1元/秒
  • 失败任务不收费

可灵 API(Kling V2)

文档: https://klingai.kuaishou.com/api/docs

端点: https://api.klingai.com/v1/videos/text2video

认证: 需要 JWT Token(用 Access Key + Secret Key 生成)

优势: 人物动作更自然,长视频片段表现好

提示词技巧(分镜师专用)

描述运动,不只是画面

? "海边的日落" ? "镜头缓缓推进,海浪拍打礁石,夕阳的橙红色光芒在水面上跳跃"

前置主体

模型对提示词前几个词权重更高: ? "一个身穿红裙的女孩,在樱花树下旋转,花瓣飞舞"

镜头语言

  • 推镜:camera slowly pushes in / 镜头缓缓推近
  • 拉镜:camera pulls back / 镜头拉远
  • 跟拍:tracking shot / 跟拍镜头
  • 摇镜:pan left/right / 镜头向左/右摇

图生视频注意

  • 图片分辨率够高(建议1280x720以上)
  • 提前裁剪为目标比例(16:9 or 9:16)
  • 图中有隐含动势效果更好(飘动的头发、奔跑姿势)

成本控制

  1. 先用5秒/720P验证 prompt
  2. 满意后再用10-15秒/1080P出成品
  3. 生成失败不收费,大胆试
  4. 视频 URL 有效期有限,生成后及时下载

飞书发送

生成的视频可通过 message tool 直接发送:

# 下载到本地后用 media 参数发送
message(action="send", channel="feishu", media="/path/to/video.mp4", contentType="video/mp4")