飞书语音助手:AI 文本转语音集成 - Openclaw Skills

作者:互联网

2026-03-28

AI教程

什么是 飞书语音助手?

飞书语音助手是一个专门设计的集成工具,旨在弥合文本自动化与以人为本的语音沟通之间的差距。通过利用 Duby AI 进行先进的文本转语音 (TTS) 生成,Openclaw Skills 集合中的这一项允许开发人员以编程方式将音频消息直接调度到飞书 (Lark) 生态系统中。

该工具对于希望提供更具可访问性或紧急通知的组织特别有价值,这些通知在繁忙的聊天环境中能够脱颖而出。通过利用原生音频格式,该技能确保消息以标准语音备忘录的形式传递,为飞书移动或桌面应用程序中的接收者提供无缝体验。

下载入口:https://github.com/openclaw/skills/tree/main/skills/autogame-17/feishu-voice-assistant

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install feishu-voice-assistant

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级:工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 feishu-voice-assistant。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。

飞书语音助手 应用场景

  • 将关键系统警报作为语音消息发送,以确保值班工程师注意到它们。
  • 为团队成员自动生成个性化的早报或每日站立会议摘要。
  • 通过在部门频道中为文本较多的公告提供音频替代方案来增强无障碍性。
  • 将逼真的 AI 语音集成到内部机器人交互中,以提高 Openclaw Skills 工作流中的用户参与度。
飞书语音助手 工作原理
  1. 用户通过命令行界面提供文本字符串和目标飞书 ID。
  2. 该技能将文本发送到 Duby AI API,使用指定或默认的语音 ID 生成高质量音频文件。
  3. 系统使用内部凭据向飞书进行身份验证,以获取必要的上传权限。
  4. 生成的音频文件作为语音资源上传到飞书文件服务器。
  5. 发起最终的 API 调用,使用上传的文件引用将语音消息传递给指定的用户或群聊。

飞书语音助手 配置指南

要开始使用此技能,请确保您的环境中配置了 API 凭证。将以下内容添加到您的 .env 文件中:

DUBY_API_KEY=your_duby_api_key
FEISHU_APP_ID=your_feishu_app_id
FEISHU_APP_SECRET=your_feishu_app_secret

安装必要的依赖项并使用 Node.js 运行脚本:

node skills/feishu-voice-assistant/index.js --text "您的消息" --target "ou_your_user_id"

飞书语音助手 数据架构与分类体系

该技能按照以下架构处理数据,以确保与 Openclaw Skills 标准兼容:

属性 描述 必填
text 要转换为语音的输入字符串。
target 飞书 Open User ID (ou_...) 或 Open Chat ID (oc_...)。
voice Duby 语音 ID(如果未指定,默认为 Xinduo)。
payload 包含生成的音频缓冲区的多部分表单数据。 内部
name: feishu-voice-assistant
description: Sends voice messages (audio) to Feishu chats using Duby TTS.
tags: [feishu, voice, tts, audio]

Feishu Voice Assistant

Generate speech from text using Duby AI and send it as a native voice message (audio) to Feishu.

Usage

Send a Voice Message

node skills/feishu-voice-assistant/index.js --text "Hello, this is a voice message!" --target "$TARGET_USER_ID"

Options

  • --text: The text to convert to speech.
  • --target: The Feishu user ID (ou_...) or chat ID (oc_...).
  • --voice: (Optional) Duby Voice ID. Default is Xinduo.

Dependencies

  • duby: For TTS generation.
  • feishu-common: For API authentication.
  • form-data: For file uploads.

Configuration

Requires DUBY_API_KEY and Feishu credentials in .env.