Anthropic 开源了 Claude 的 Agent Skills 仓库:文档技能的底层实现全公开了
作者:互联网
2026-04-13
Anthropic 开源了 Claude 的 Agent Skills 仓库:文档技能的底层实现全公开了
背景:什么是 Agent Skills?
如果你最近在用 Claude.ai,可能注意到它能直接创建 .docx、.pdf、.pptx、.xlsx 文件,格式完整,排版规范。
这背后的机制叫 Agent Skills:一种让 AI Agent 动态加载专项能力的架构。
和 MCP(Model Context Protocol)不同,Skills 的重点不是"连接外部工具",而是"教会 AI 如何完成特定任务"。具体来说:
- MCP:我需要连接 Notion → 告诉 AI Notion 的 API
- Skills:我需要创建 Word 文档 → 告诉 AI 怎么用
docx.js生成符合规范的.docx文件
anthropics/skills 仓库里有什么?
仓库地址:github.com/anthropics/…
1. 四个文档技能(Source-Available)
这四个技能是 Claude.ai 文档功能的实际底层实现,Anthropic 以"参考开放"形式发布:
| 技能 | 功能 | 主要依赖 |
|---|---|---|
skills/docx | Word 文档创建/编辑/分析 | docx(npm)、pandoc、LibreOffice |
skills/pdf | PDF 创建与处理 | pandoc、pdftoppm |
skills/pptx | PowerPoint 创建 | pptxgenjs |
skills/xlsx | Excel 创建与数据处理 | xlsx(SheetJS) |
2. 开源技能集(Apache 2.0)
- 创意类:艺术生成、音乐创作、设计输出
- 技术类:Web 应用测试、MCP Server 自动生成
- 企业类:内部沟通模板、品牌规范执行
深入看:docx skill 的实现思路
以最常用的 docx 技能为例,来看看 Anthropic 怎么教 Claude 创建 Word 文档。
核心工作流
用户请求 → 触发 SKILL.md → AI 执行脚本 → 生成文件 → 验证 → 返回
技术栈选择
用 docx(npm 包)而不是直接拼 XML,原因很实在:
const { Document, Packer, Paragraph, TextRun, Table,
TableRow, TableCell, ImageRun, Header, Footer,
TableOfContents, HeadingLevel } = require('docx');
const doc = new Document({
sections: [{
children: [/* 内容节点 */]
}]
});
Packer.toBuffer(doc).then(buffer =>
fs.writeFileSync("output.docx", buffer)
);
一个容易踩的坑
docx-js 默认页面尺寸是 A4,不是美式 Letter。需要显式设置:
sections: [{
properties: {
page: {
size: {
width: 12240, // 8.5 inches in DXA (twips)
height: 15840 // 11 inches in DXA
}
}
}
}]
验证机制
生成完不算完,还有一个验证步骤:
python scripts/office/validate.py doc.docx
如果验证失败,会解包 XML → 修复 → 重新打包。这种"生成-验证-修复"循环是生产级可靠性的保障。
SKILL.md:Agent Skills 的核心
每个 Skill 的入口是一个 SKILL.md 文件,它告诉 AI:
- 什么时候使用这个技能(触发条件)
- 有哪些工具和脚本可用
- 标准工作流程是什么
以 docx 技能的描述为例:
name: docx
description: |
Use this skill whenever the user wants to create, read, edit, or
manipulate Word documents (.docx files).
Triggers: 'Word doc', 'word document', '.docx', professional documents
with formatting like tables of contents, headings, page numbers, letterheads.
Do NOT use for PDFs, spreadsheets, or Google Docs.
license: Proprietary
触发条件写得很精确,避免误触发。这是 Skills 设计的一个要点:精准路由,不是越宽越好。
和 OpenClaw Skills 的关系
OpenClaw 使用了同一个 AgentSkills 标准(参见 agentskills.io),文件结构完全相同:
skill-name/
├── SKILL.md # 技能描述和工作流
├── scripts/ # 可执行脚本
├── references/ # 参考文档
└── README.md # 可选
这意味着:
anthropics/skills里的技能设计思路可以直接借鉴到 OpenClaw- 特别是验证机制和错误恢复流程的设计
- 触发条件的精确描述方式也值得学习
为什么这个仓库值得关注?
1. 生产级实现,不是 Demo
这是 Claude.ai 实际在用的代码。不是教程里随手写的 demo,是处理了真实用户各种奇葩需求之后沉淀出来的实现。
2. 技能标准正在成熟
AgentSkills 标准从 Anthropic 内部走向开放,意味着:
- AI 生态的"技能市场"有了统一格式
- 技能可以跨平台复用(Claude、OpenClaw、未来其他 Agent)
- 社区可以形成技能库(类似 npm 之于 Node.js)
3. 文档类任务是 AI Agent 的高频需求
需求报告、周报、提案……这些任务天天都有。有了标准化的文档生成技能,AI Agent 在办公自动化场景的能力上了一个台阶。
如何上手?
看代码
git clone
ls skills/skills/
# docx pdf pptx xlsx ...
在 OpenClaw 里复用设计思路
如果你在维护自己的 OpenClaw Skills,建议参考:
docx/SKILL.md的触发条件写法docx/scripts/validate.py的验证-修复模式- 整体的"脚本 + 描述文件"分离结构
总结
anthropics/skills 不是一个炫技项目,是一个工程参考:
- 文档技能的实际实现(Source-Available)
- Agent Skills 标准的最权威示例
- 生产环境的验证机制和错误处理
如果你在做 AI Agent 的技能开发,这个仓库应该加入书签。
仓库地址:github.com/anthropics/…
AgentSkills 标准:agentskills.io
Claude 文档功能博客:anthropic.com/engineering…
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
告别AI塑料感?通义Z-Image开源:6B参数要把“大众脸”送进历史堆
Agent 自学指南1 - 别只会"Hi"了:给大模型装上手脚,5分钟变身 Agent
Claude Agent SDK 使用指南:如何优雅地处理用户审批与提问 (User Input)
一天一个开源项目(第29篇):Open-AutoGLM - 用自然语言操控手机的 Phone Agent 框架
Plugin 扩展实战:增强 Claude Code 的能力
【搭建OpenClaw】
OpenClaw高级进阶技巧分享!模型精选策略+记忆系统优化经验+深度搜索集成+Gateway崩溃自动修复!Claude Code自动读日志修Bug重启验证
解决 OpenClaw 飞书插件 API 过度调用问题
2025,AI这一年:从“卷参数“到“卷落地“的转折之年
openclaw和opencode组合使用
AI精选
