Geepers Corpus：语言分析与 COCA 集成 - Openclaw Skills-脚本在线

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

Geepers Corpus：语言分析与 COCA 集成 - Openclaw Skills

作者：互联网

2026-03-31

AI教程

什么是 Geepers Corpus？

Geepers Corpus 是 Openclaw Skills 的专业技术集成，提供对美国当代英语语料库 (COCA) 的程序化访问。通过与涵盖小说、学术期刊和口语媒体等不同流派的超过 10 亿个单词的数据库对接，该技能使 AI 代理能够验证现实世界的语言使用情况。它是确保文体准确性和语言精确性的重要工具。

此 Openclaw Skills 技能允许开发人员和研究人员通过分析 1990 年至今美式英语中单词的实际使用方式，超越简单的词典定义。它弥合了静态语言模型与动态、数据驱动的语言分析之间的差距。

下载入口:https://github.com/openclaw/skills/tree/main/skills/lukeslp/geepers-corpus

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install geepers-corpus

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级：工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 geepers-corpus。如果尚未安装 Clawhub，请先安装（npm i -g clawhub）。

Geepers Corpus 应用场景

在美式英语资源中验证特定术语的正式程度或频率。
寻找自然的词汇搭配，以提高生成内容的流畅度和真实性。
针对语境中的关键词 (KWIC) 使用模式进行学术语言研究。
识别不同年代和流派的历史使用趋势和频率变化。

Geepers Corpus 工作原理

技能通过使用安全环境变量在 Dreamer API 进行身份验证来初始化。
用户或 AI 代理触发特定的查询类型，例如单词搜索、搭配分析或频率检查。
系统处理流派过滤器（如学术、小说）等参数，以缩小语言数据的范围。
API 返回包含使用示例、MI 分数和每百万词频指标的结构化 JSON 数据，供 Openclaw Skills 解释和展示。

Geepers Corpus 配置指南

要在您的环境中激活此技能，请确保您拥有来自 Dreamer 服务的有效 API 密钥。通过在终端中运行以下命令来配置您的环境：

export DREAMER_API_KEY=your_key_here

密钥设置完成后，Openclaw Skills 即可成功将请求路由到 https://api.dr.eamer.dev 端点。

Geepers Corpus 数据架构与分类体系

Geepers Corpus 技能基于三个主要的语言功能组织数据。下表概述了返回给 Openclaw Skills 的数据结构：

功能	参数	返回数据
单词搜索	`word`, `limit`	显示使用示例的 KWIC（语境中的关键词）示例。
词汇搭配	`word`, `pos`, `limit`	包含 MI 分数和频率的统计共现数据。
词频	`word`, `genre`	特定媒体类型中每百万单词的出现频率。

name: geepers-corpus
description: Query the COCA (Corpus of Contemporary American English) linguistics API for word frequency, collocations, concordances, and historical usage trends. Use for linguistic research, writing assistance, or understanding how words are actually used in American English.

Dreamer Corpus

Access the COCA corpus API at https://api.dr.eamer.dev.

COCA contains 1+ billion words of contemporary American English from spoken, fiction, magazine, newspaper, and academic sources.

Authentication

export DREAMER_API_KEY=your_key_here

Endpoints

Word Search / Concordance

GET https://api.dr.eamer.dev/v1/corpus/search?word=serendipity&limit=20

Returns KWIC (keyword-in-context) examples showing the word in actual usage.

Collocations

GET https://api.dr.eamer.dev/v1/corpus/collocations?word=run&pos=verb&limit=20

Returns words that statistically co-occur with the target word (MI score, frequency).

Frequency

GET https://api.dr.eamer.dev/v1/corpus/frequency?word=algorithm&genre=academic

Returns frequency per million words, with optional genre filter: spoken, fiction, magazine, newspaper, academic.

When to Use

Checking how formal or common a word is in real American English
Finding natural collocations for writing assistance
Linguistic research on word usage patterns
Historical frequency trends across decades

Don't Use When

You need non-English corpora
You need corpora other than contemporary American English (COCA is 1990-present)

上一篇：教会账户自动化：管理 LDS 和 LCR 任务 - Openclaw Skills 下一篇：OpenClaw 静默自动更新：自动化 CLI 维护 - Openclaw Skills

相关推荐

2026年云原生开发者调查报告：平台工程采用现状与成熟度分析 2026年云原生开发者调查报告分析了平台工程在三大领域的采用现状与成熟度。报告评估了工作流自动化、应用交付及安全合规管理的核心工具，包括GitHub Actions、Helm、Keycloak等技术的实用性与稳定性。数据显示Armada成熟度最高，而新兴工具Crossplane和kro获得开发者高度推荐。41%组织采用多团队协作平台模式，35%选择混合平台应对AI工作流挑战。

2026-03-31

立即查看

软件所发布首个本地通用幻灯片智能体模型及环境系统开源版本中国科学院软件研究所开源第二代幻灯片智能体系统PPTagent，首次实现智能体模型与沙箱环境同步开源。该系统通过环境感知反思机制优化排版流程，集成20余种专业工具确保内容专业性，支持消费级显卡部署并适配国产算力生态。9B版本在测试中接近闭源模型表现，提供可编辑pptx格式输出。

2026-03-31

立即查看

中国科学院开启新一代开源芯片与系统技术攻关中国科学院发布香山开源处理器与如意原生操作系统，标志着我国在RISC-V芯片架构与系统技术领域取得重大突破。新一代开源芯片性能达国际先进水平，实现规模化产业落地，有效降低企业研发成本。产学研联合启动昆明湖架构研发，加速构建自主可控的芯片与操作系统生态体系。

2026-03-31

立即查看

2026-03-31

立即查看

专题

#Grok

Grok脚本资源网站，提供G

+ 收藏

#Sora2

Sora2脚本资源网站，提供S

+ 收藏

#通义万相

通义万相脚本资源网站，提供通

+ 收藏

#海螺AI

海螺AI脚本资源网站，提供海

+ 收藏

#可灵AI

可灵AI脚本资源网站，提供可

+ 收藏

#Kling3.0

Kling3.0脚本资源网站，提

+ 收藏

最新数据

Meditate：主动式 AI 反思与见解生成 - Openclaw Skills 什么是冥想 (Meditate

UniOne Email API：高送达率事务性邮件 - Openclaw Skills

Jarvis API 合约守卫：API 稳定性与兼容性 - Openclaw 技能

Libby 图书监控器：追踪图书馆藏书可用性 - Openclaw Skills

ClawVault：便携式智能体身份与记忆同步 - Openclaw Skills

我做了一个专为油猴打造的轻量级 Vue 组件注入库

纯干货，前端字体极致优化！谷歌、阿里、字节、腾讯都在用的终极解决方案，Vue3 + Vite 直接抄，页面提速不妥协！

Vue3 路由实战 | Vue Router 从 0 到 1 搭建权限管理系统

基于micro-app的微前端落地实践

VTJ.PRO 在线应用开发平台前端架构

名号永生者：加密资产风险与活力评估 - Openclaw 技能

03/31

Openclaw 飞书优化器：提升飞书消息体验 - Openclaw 技能

03/31

AI 图像提示词：10,000+ 精选资源库 - Openclaw Skills

03/31

DHT11 传感器集成：温湿度监控 - Openclaw Skills

03/31

自动推文调度器：Twitter 内容管理 - Openclaw Skills

03/31

膳食规划器：自动化的每周菜单和购物清单 - Openclaw Skills

03/31

verify-claim: 实时事实核查与数据验证 - Openclaw Skills

03/31

Jarvis 事故时间线编写器：自动化技术工作流 - Openclaw Skills

03/31

DuckDuckGo 网页搜索：AI 智能体私密搜索 - Openclaw Skills

03/31

Peloton 统计：通过 API 追踪骑行表现 - Openclaw Skills

03/31

AI精选

MCP 协议深度解析：构建 A

OpenClaw 真正的效率开

精选

Anthropic 的 Harness 启示：当 AI Agent 开始「长跑」，架构才是真正的天花板

精选

AI Agent 智能体 - Multi-Agent 架构入门

精选

RAG 不一定非得靠向量库：一套更偏工程落地的“结构化推理检索”方案

精选

一文搞懂深度学习中的池化！

精选

一文搞懂卷积神经网络经典架构-LeNet

精选

告别 Vibe Coding：用 SDD 让 AI 编程提效 50%，三工具实战对比

精选

Agent 语音交互如何更稳、更快？一次高并发消息链路优化实践

精选

# AI 终于能"干活"了——Function Calling 完全指南

脚本推荐

SeeDance 2.0 Video Creator专区

OpenClaw AI专区

cowork专区

claude code skills专区