Gemini Image Simple：零依赖 AI 图像生成

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

Gemini Image Simple：零依赖 AI 图像生成 - Openclaw Skills

作者：互联网

2026-03-20

AI教程

什么是 Gemini Image Simple？

Gemini Image Simple 是一款功能强大、轻量级的实用工具，旨在为受限的包管理环境提供高质量的 AI 图像生成与编辑功能。作为 Openclaw Skills 库中的独特成员，它完全依赖 Python 标准库运行，这意味着无需 pip 安装，无需虚拟环境，在锁定系统或极简容器中也能完美运行。它利用 Google 的 Nano Banana Pro (Gemini 3 Pro Image) 以零设置开销提供专业级结果。

该技能对于使用 Openclaw Skills 的开发者尤为宝贵，特别是那些需要在 Fly.io 等免费云平台或受限 Docker 镜像中运行可靠图像生成工具的用户。通过利用 Python 原生的 urllib 和 base64 模块，它在不增加外部依赖负担的情况下确保了最大的兼容性和性能。

下载入口:https://github.com/openclaw/skills/tree/main/skills/cluka-399/gemini-image-simple

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install gemini-image-simple

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级：工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 gemini-image-simple。如果尚未安装 Clawhub，请先安装（npm i -g clawhub）。

Gemini Image Simple 应用场景

在没有 pip 或 uv 访问权限的环境中，根据文本提示生成写实的图像。
通过提供自然语言指令和源文件来编辑现有图像。
将 AI 图像生成集成到 CI/CD 流水线或轻量级无服务器函数中。
在仅支持 Python 3 的受限或物理隔离系统中部署视觉 AI 能力。
通过可靠且无依赖的媒体生成层增强 Openclaw Skills 工作流。

Gemini Image Simple 工作原理

用户通过 Python 3 执行脚本，传递文本提示及可选的输入图像进行编辑。
该技能从环境变量中读取 GEMINI_API_KEY，以便向 Google AI 服务进行身份验证。
利用内置的 urllib.request 模块，该技能向 Gemini API 端点发送结构化的 JSON 负载。
Google 的 Nano Banana Pro 模型处理提示词（以及源图像，如果提供的话）以生成新的视觉数据。
该技能接收 base64 编码的图像数据，使用原生 base64 库进行解码，并将最终文件写入指定的输出路径。

Gemini Image Simple 配置指南

要将其集成到您的 Openclaw Skills 设置中，请确保您拥有来自 Google AI Studio 的有效 API 密钥。如下设置您的环境变量：

export GEMINI_API_KEY='your_api_key_here'

然后，您可以使用任何 Python 3.10+ 环境立即运行该技能：

python3 scripts/generate.py "火星的电影级景观" mars.png

Gemini Image Simple 数据架构与分类体系

该技能主要通过标准文件系统输入和输出管理数据，无需外部数据库。

组件	详情
支持的输入	PNG, JPG, JPEG, GIF, WEBP
输出格式	生成标准 PNG 图像文件
依赖项	纯 Python 标准库 (urllib, json, base64)
模型	默认为 nano-banana-pro-preview (Gemini 3 Pro Image)
文件结构	脚本包含在 scripts/ 目录中以便模块化访问

name: gemini-image-simple
version: 1.1.0
description: Generate and edit images with Gemini API using pure Python stdlib. Zero dependencies - works on locked-down environments where pip/uv aren't available.
metadata:
  openclaw:
    emoji: "??"
    requires:
      env: ["GEMINI_API_KEY"]

Gemini Image Simple

Generate and edit images using Google's Nano Banana Pro (Gemini 3 Pro Image) - the highest quality image generation model.

Why This Skill

Feature	This Skill	Others (nano-banana-pro, etc.)
Dependencies	None (stdlib only)	google-genai, pillow, etc.
Requires pip/uv	? No	? Yes
Works on Fly.io free	? Yes	? Fails
Works in containers	? Yes	? Often fails
Image generation	? Full	? Full
Image editing	? Yes	? Yes
Setup complexity	Just set API key	Install packages first

Bottom line: This skill works anywhere Python 3 exists. No package managers, no virtual environments, no permission issues.

Quick Start

# Generate
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py "A cat wearing a tiny hat" cat.png

# Edit existing image  
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py "Make it sunset lighting" edited.png --input original.png

Usage

Generate new image

python3 {baseDir}/scripts/generate.py "your prompt" output.png

Edit existing image

python3 {baseDir}/scripts/generate.py "edit instructions" output.png --input source.png

Supported input formats: PNG, JPG, JPEG, GIF, WEBP

Environment

Set GEMINI_API_KEY environment variable. Get one at https://aistudio.google.com/apikey

How It Works

Uses Nano Banana Pro (nano-banana-pro-preview) - Google's highest quality image generation model:

Pure urllib.request for HTTP (no requests library)
Pure json for parsing (stdlib)
Pure base64 for encoding (stdlib)

That's it. No external packages. Works on any Python 3.10+ installation.

Model

Currently using: nano-banana-pro-preview (also known as Gemini 3 Pro Image)

Other available models (can be changed in generate.py if needed):

gemini-3-pro-image-preview - Same as Nano Banana Pro
imagen-4.0-ultra-generate-001 - Imagen 4.0 Ultra
imagen-4.0-generate-001 - Imagen 4.0
gemini-2.5-flash-image - Gemini 2.5 Flash with image gen

Examples

# Landscape
python3 {baseDir}/scripts/generate.py "Misty mountains at sunrise, photorealistic" mountains.png

# Product shot
python3 {baseDir}/scripts/generate.py "Minimalist product photo of a coffee cup, white background" coffee.png

# Edit: change style
python3 {baseDir}/scripts/generate.py "Convert to watercolor painting style" watercolor.png --input photo.jpg

# Edit: add element
python3 {baseDir}/scripts/generate.py "Add a rainbow in the sky" rainbow.png --input landscape.png

上一篇：Grok 搜索：实时网页与 X 搜索代理 - Openclaw Skills 下一篇：Antigravity Quota：监控 Claude 和 Gemini 额度 - Openclaw 技能