Gemini Image Simple:零依赖 AI 图像生成 - Openclaw Skills
作者:互联网
2026-03-20
什么是 Gemini Image Simple?
Gemini Image Simple 是一款功能强大、轻量级的实用工具,旨在为受限的包管理环境提供高质量的 AI 图像生成与编辑功能。作为 Openclaw Skills 库中的独特成员,它完全依赖 Python 标准库运行,这意味着无需 pip 安装,无需虚拟环境,在锁定系统或极简容器中也能完美运行。它利用 Google 的 Nano Banana Pro (Gemini 3 Pro Image) 以零设置开销提供专业级结果。
该技能对于使用 Openclaw Skills 的开发者尤为宝贵,特别是那些需要在 Fly.io 等免费云平台或受限 Docker 镜像中运行可靠图像生成工具的用户。通过利用 Python 原生的 urllib 和 base64 模块,它在不增加外部依赖负担的情况下确保了最大的兼容性和性能。
下载入口:https://github.com/openclaw/skills/tree/main/skills/cluka-399/gemini-image-simple
安装与下载
1. ClawHub CLI
从源直接安装技能的最快方式。
npx clawhub@latest install gemini-image-simple
2. 手动安装
将技能文件夹复制到以下位置之一
全局模式~/.openclaw/skills/
工作区
/skills/
优先级:工作区 > 本地 > 内置
3. 提示词安装
将此提示词复制到 OpenClaw 即可自动安装。
请帮我使用 Clawhub 安装 gemini-image-simple。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。
Gemini Image Simple 应用场景
- 在没有 pip 或 uv 访问权限的环境中,根据文本提示生成写实的图像。
- 通过提供自然语言指令和源文件来编辑现有图像。
- 将 AI 图像生成集成到 CI/CD 流水线或轻量级无服务器函数中。
- 在仅支持 Python 3 的受限或物理隔离系统中部署视觉 AI 能力。
- 通过可靠且无依赖的媒体生成层增强 Openclaw Skills 工作流。
- 用户通过 Python 3 执行脚本,传递文本提示及可选的输入图像进行编辑。
- 该技能从环境变量中读取 GEMINI_API_KEY,以便向 Google AI 服务进行身份验证。
- 利用内置的 urllib.request 模块,该技能向 Gemini API 端点发送结构化的 JSON 负载。
- Google 的 Nano Banana Pro 模型处理提示词(以及源图像,如果提供的话)以生成新的视觉数据。
- 该技能接收 base64 编码的图像数据,使用原生 base64 库进行解码,并将最终文件写入指定的输出路径。
Gemini Image Simple 配置指南
要将其集成到您的 Openclaw Skills 设置中,请确保您拥有来自 Google AI Studio 的有效 API 密钥。如下设置您的环境变量:
export GEMINI_API_KEY='your_api_key_here'
然后,您可以使用任何 Python 3.10+ 环境立即运行该技能:
python3 scripts/generate.py "火星的电影级景观" mars.png
Gemini Image Simple 数据架构与分类体系
该技能主要通过标准文件系统输入和输出管理数据,无需外部数据库。
| 组件 | 详情 |
|---|---|
| 支持的输入 | PNG, JPG, JPEG, GIF, WEBP |
| 输出格式 | 生成标准 PNG 图像文件 |
| 依赖项 | 纯 Python 标准库 (urllib, json, base64) |
| 模型 | 默认为 nano-banana-pro-preview (Gemini 3 Pro Image) |
| 文件结构 | 脚本包含在 scripts/ 目录中以便模块化访问 |
name: gemini-image-simple
version: 1.1.0
description: Generate and edit images with Gemini API using pure Python stdlib. Zero dependencies - works on locked-down environments where pip/uv aren't available.
metadata:
openclaw:
emoji: "??"
requires:
env: ["GEMINI_API_KEY"]
Gemini Image Simple
Generate and edit images using Google's Nano Banana Pro (Gemini 3 Pro Image) - the highest quality image generation model.
Why This Skill
| Feature | This Skill | Others (nano-banana-pro, etc.) |
|---|---|---|
| Dependencies | None (stdlib only) | google-genai, pillow, etc. |
| Requires pip/uv | ? No | ? Yes |
| Works on Fly.io free | ? Yes | ? Fails |
| Works in containers | ? Yes | ? Often fails |
| Image generation | ? Full | ? Full |
| Image editing | ? Yes | ? Yes |
| Setup complexity | Just set API key | Install packages first |
Bottom line: This skill works anywhere Python 3 exists. No package managers, no virtual environments, no permission issues.
Quick Start
# Generate
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py "A cat wearing a tiny hat" cat.png
# Edit existing image
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py "Make it sunset lighting" edited.png --input original.png
Usage
Generate new image
python3 {baseDir}/scripts/generate.py "your prompt" output.png
Edit existing image
python3 {baseDir}/scripts/generate.py "edit instructions" output.png --input source.png
Supported input formats: PNG, JPG, JPEG, GIF, WEBP
Environment
Set GEMINI_API_KEY environment variable. Get one at https://aistudio.google.com/apikey
How It Works
Uses Nano Banana Pro (nano-banana-pro-preview) - Google's highest quality image generation model:
- Pure
urllib.requestfor HTTP (no requests library) - Pure
jsonfor parsing (stdlib) - Pure
base64for encoding (stdlib)
That's it. No external packages. Works on any Python 3.10+ installation.
Model
Currently using: nano-banana-pro-preview (also known as Gemini 3 Pro Image)
Other available models (can be changed in generate.py if needed):
gemini-3-pro-image-preview- Same as Nano Banana Proimagen-4.0-ultra-generate-001- Imagen 4.0 Ultraimagen-4.0-generate-001- Imagen 4.0gemini-2.5-flash-image- Gemini 2.5 Flash with image gen
Examples
# Landscape
python3 {baseDir}/scripts/generate.py "Misty mountains at sunrise, photorealistic" mountains.png
# Product shot
python3 {baseDir}/scripts/generate.py "Minimalist product photo of a coffee cup, white background" coffee.png
# Edit: change style
python3 {baseDir}/scripts/generate.py "Convert to watercolor painting style" watercolor.png --input photo.jpg
# Edit: add element
python3 {baseDir}/scripts/generate.py "Add a rainbow in the sky" rainbow.png --input landscape.png
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
信号管道:自动化营销情报工具 - Openclaw Skills
技能收益追踪器:监控 Openclaw 技能并实现变现
AI 合规准备就绪度:评估与治理工具 - Openclaw Skills
FOSMVVM ServerRequest 测试生成器:自动化 API 测试 - Openclaw Skills
酒店搜索器:AI 赋能的住宿与位置情报 - Openclaw Skills
Dub 链接 API:程序化链接管理 - Openclaw Skills
IntercomSwap:P2P BTC 与 USDT 跨链兑换 - Openclaw Skills
spotplay:macOS 原生 Spotify 播放控制 - Openclaw Skills
DeepSeek OCR:AI驱动的图像文本识别 - Openclaw Skills
Web Navigator:自动化网页研究与浏览 - Openclaw Skills
AI精选
