Clawzempic:优化大模型成本与显存 - Openclaw Skills

作者:互联网

2026-04-17

AI教程

什么是 Clawzempic?

Clawzempic 是一款高性能、即插即用的大模型代理,旨在最大限度地提高 Openclaw Skills 生态系统内 AI 工作流的效率。它能在 2 毫秒内自动评估每个传入请求的复杂度,并将任务路由至最具成本效益的模型层级,确保您无需为简单的补全任务支付过高费用。该技能为 Anthropic 和 OpenRouter 提供了无缝接口,让开发者能够专注于构建应用,而非管理 API 预算。

除了成本优化,Clawzempic 还为您的智能体添加了一个高级记忆层。它能处理从短期会话上下文到长期基于嵌入(embedding)的回溯等所有事务,无需开发者手动管理状态。作为 Openclaw Skills 的核心补充,它弥合了高推理性能与预算敏感型开发之间的鸿沟。

下载入口:https://github.com/openclaw/skills/tree/main/skills/naveenspark/clawzempic

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install clawzempic

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级:工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 clawzempic。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。

Install

Clawzempic 应用场景

  • 通过将简单指令路由至高效模型层级来减少 API 开销。
  • 使用内置的便签(scratchpad)和核心记忆功能保持跨不同会话的上下文。
  • 监控 AI 智能体部署的实时资金节省情况和连接健康状态。
  • 通过基于嵌入的存储扩展需要长期回溯的 AI 智能体,无需手动进行提示词工程。
Clawzempic 工作原理
  1. 该技能捕获传入请求,并应用加权多维评分器在不到 2 毫秒内确定任务复杂度。
  2. 它将流量路由至四个层级之一:简单(节省高达 95%)、中等(节省高达 80%)、复杂或推理。
  3. 它自动管理服务端记忆,将信息分类为近期活动、便签和核心记忆。
  4. 针对每个请求应用上下文窗口化,确保处理最相关的数据而不导致 Token 膨胀。
  5. 结果返回给智能体的同时,记录指标用于集成节省概览面板。

Clawzempic 配置指南

要将此技能集成到您的环境中,请使用以下命令:

openclaw plugins install clawzempic

对于独立使用或通过 NPX 进行测试,请运行:

npx clawzempic

要检查配置并查看累计节省金额,请使用以下诊断命令:

npx clawzempic doctor
npx clawzempic savings

Clawzempic 数据架构与分类体系

Clawzempic 将其内部数据和记忆组织成不同的层级,以优化检索和成本:

组件 范围 功能
近期活动 会话级别 即时对话历史
便签 跨会话 进行中任务的工作笔记
核心记忆 永久 用户偏好和静态事实
长期回溯 全局 基于嵌入的向量搜索
节省指标 账户级别 追踪成本降低和层级分布
name: clawzempic
version: 2.3.5
description: Save 70-95% on LLM costs with smart routing, caching, and memory.
author: Clawzempic
homepage: https://clawzempic.ai
license: MIT
keywords: [llm, proxy, routing, caching, cost-optimization, memory, anthropic, openrouter]
metadata:
  openclaw:
    emoji: "?"
    category: ai-tools
    requires:
      env: []

Clawzempic

Drop-in LLM proxy that routes simple requests to cheaper models, caches repeated context, and adds cross-session memory. Works with Anthropic and OpenRouter keys.

Install

openclaw plugins install clawzempic

The plugin handles signup, auth, and model registration automatically.

Or standalone:

npx clawzempic

How It Works

Every request is scored for complexity in <2ms and routed to the right tier:

Tier Traffic Savings
Simple ~45% up to 95%
Mid ~25% up to 80%
Complex ~20% 0% (full quality)
Reasoning ~10% 0% (full quality)

No LLM classifier in the hot path. Weighted multi-dimension scorer handles routing.

Memory

Server-side memory across sessions. No plugins, no extra API keys, no config. Your agent doesn't need to "remember" to remember.

  • Recent activity (per-session)
  • Scratchpad (cross-session working notes)
  • Context windowing (per-request)
  • Core memory (permanent facts and preferences)
  • Long-term recall (embedding-based)

Verify

npx clawzempic doctor    # Check config + test connection
npx clawzempic savings   # Savings dashboard
  • Website: https://clawzempic.ai
  • Dashboard: https://www.clawzempic.ai/dash
  • npm: https://www.npmjs.com/package/clawzempic

相关推荐