腾讯会议导出工具:提取 AI 逐字稿和摘要 - Openclaw Skills

作者:互联网

2026-04-13

AI教程

什么是 腾讯会议导出工具?

腾讯会议导出工具是一款功能强大的实用程序,旨在填补云端视频录制与可操作文本数据之间的空白。此技能使开发人员和研究人员能够以编程方式从腾讯会议公开分享链接中检索完整的转录数据,而无需手动登录。通过利用先进的浏览器自动化技术,它不仅能捕捉语音内容,还能捕捉平台生成的智能元数据。

作为 Openclaw Skills 库的一部分,该工具对于希望将会议智能集成到现有文档工作流中的团队至关重要。它专门处理懒加载和 API 拦截的复杂性,以确保对话的每个片段(包括发言人身份和时间戳)都以开发人员友好的格式准确保存。

下载入口:https://github.com/openclaw/skills/tree/main/skills/snow-dust/tencent-meeting-export

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install tencent-meeting-export

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级:工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 tencent-meeting-export。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。

腾讯会议导出工具 应用场景

  • 将腾讯会议公开录像转换为可搜索的 Markdown 文档。
  • 导出 AI 生成的会议摘要,以便集成到项目管理工具中。
  • 存档智能章节和关键会议事件(如屏幕共享),用于合规性或复盘。
  • 提取原始 JSON 会议数据,用于自定义自然语言处理和情感分析。
腾讯会议导出工具 工作原理
  1. 该工具通过 Playwright 初始化无头 Chromium 浏览器,以加载提供的公开分享 URL。
  2. 它拦截来自腾讯会议后端的特定 API 响应,包括会议详情、摘要和逐字稿段落。
  3. 该技能自动与页面交互,切换到逐字稿选项卡并滚动以触发所有对话片段的懒加载。
  4. 它解析拦截到的 JSON 负载,以提取发言人姓名、头像、时间戳和每句话的文本内容。
  5. 收集到的数据被格式化为结构化的 Markdown 或 JSON 文件,并保存到用户的本地目录。

腾讯会议导出工具 配置指南

要从 Openclaw Skills 使用此技能,请确保已安装 Python,然后设置 Playwright 环境:

pip install playwright
playwright install chromium

通过传递有效的公开分享链接来运行导出脚本:

python scripts/tencent_meeting_export.py 

腾讯会议导出工具 数据架构与分类体系

导出的数据组织在详细的分层结构中,以维护上下文和归属关系。主要数据点包括:

元素 描述
AI 全文摘要 平台 AI 生成的全面摘要。
智能章节 基于主题的分段,包含相关时间戳和简短描述。
关键节点 事件日志,如屏幕共享开始/停止以及参会者进入/退出。
逐字稿段落 核心对话,包含发言人详细信息、开始/结束时间戳(毫秒)以及原始文本字符串。
name: tencent-meeting-export
description: Export Tencent Meeting (腾讯会议) recording transcripts from public share links. Use when user needs to extract meeting transcription data, AI summaries, smart chapters, or critical events from Tencent Meeting cloud recordings. Supports exporting to Markdown or JSON format with speaker identification and timestamps.

Tencent Meeting Export

从腾讯会议公开分享链接中导出完整的会议转写内容。

导出内容

内容 说明
AI 全文摘要 腾讯会议自动生成的会议摘要
智能章节 按主题自动分段,附时间戳和概要
关键节点 屏幕共享开始/停止、成员加入/离开等事件
完整转写 逐段语音转文字,含说话人识别和时间戳

前置要求

pip install playwright
playwright install chromium

使用方法

基本用法

python scripts/tencent_meeting_export.py <分享链接>

指定输出文件

python scripts/tencent_meeting_export.py https://meeting.tencent.com/cw/xxxxx -o 会议纪要.md

导出原始 JSON 数据

# 同时导出 Markdown + JSON
python scripts/tencent_meeting_export.py https://meeting.tencent.com/cw/xxxxx --json

# 仅导出 JSON(不生成 Markdown)
python scripts/tencent_meeting_export.py https://meeting.tencent.com/cw/xxxxx --json-only -o raw.json

完整参数

positional arguments:
  url                   腾讯会议分享链接

optional arguments:
  -o, --output          输出文件路径 (默认: meeting_transcript.md)
  --json                同时导出原始 JSON 数据
  --json-only           仅导出原始 JSON 数据
  --timeout             页面加载超时时间(秒,默认 60)
  -q, --quiet           静默模式

技术原理

  1. 使用 Playwright 无头 Chromium 浏览器加载分享页面
  2. 拦截页面向后端发起的 API 请求响应:
    • v1/minutes/detail — 转写段落(懒加载分页)
    • get-full-summary — AI 摘要
    • get-chapter — 智能章节
    • get-critical-node — 关键事件节点
    • common-record-info — 会议元信息
  3. 自动点击「转写」标签页并滚动加载全部内容
  4. 将数据格式化为 Markdown(或 JSON)输出

数据结构

转写段落 (paragraph) 的关键字段:

paragraph
├── start_time / end_time  (毫秒时间戳)
├── speaker
│   ├── user_id
│   ├── user_name           ← 说话人姓名
│   └── avatar_url
└── sentences[]
    └── words[]
        └── text             ← 转写文字

限制

  • 仅支持公开分享的会议录制链接(无需登录)
  • 需要该会议已开启转写/字幕功能
  • 分享链接需在有效期内
  • 依赖腾讯会议当前的页面结构和 API,如有变更可能需要更新脚本

编程接口

也可在 Python 代码中直接调用:

import asyncio
from scripts.tencent_meeting_export import TranscriptCapture, format_markdown

async def export():
    capture = TranscriptCapture("https://meeting.tencent.com/cw/xxxxx")
    data = await capture.capture()
    md = format_markdown(data)
    print(md)

asyncio.run(export())