Gemini Image Simple:零依赖 AI 图像生成 - Openclaw Skills

作者:互联网

2026-03-20

AI教程

什么是 Gemini Image Simple?

Gemini Image Simple 是一款功能强大、轻量级的实用工具,旨在为受限的包管理环境提供高质量的 AI 图像生成与编辑功能。作为 Openclaw Skills 库中的独特成员,它完全依赖 Python 标准库运行,这意味着无需 pip 安装,无需虚拟环境,在锁定系统或极简容器中也能完美运行。它利用 Google 的 Nano Banana Pro (Gemini 3 Pro Image) 以零设置开销提供专业级结果。

该技能对于使用 Openclaw Skills 的开发者尤为宝贵,特别是那些需要在 Fly.io 等免费云平台或受限 Docker 镜像中运行可靠图像生成工具的用户。通过利用 Python 原生的 urllib 和 base64 模块,它在不增加外部依赖负担的情况下确保了最大的兼容性和性能。

下载入口:https://github.com/openclaw/skills/tree/main/skills/cluka-399/gemini-image-simple

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install gemini-image-simple

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级:工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 gemini-image-simple。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。

Gemini Image Simple 应用场景

  • 在没有 pip 或 uv 访问权限的环境中,根据文本提示生成写实的图像。
  • 通过提供自然语言指令和源文件来编辑现有图像。
  • 将 AI 图像生成集成到 CI/CD 流水线或轻量级无服务器函数中。
  • 在仅支持 Python 3 的受限或物理隔离系统中部署视觉 AI 能力。
  • 通过可靠且无依赖的媒体生成层增强 Openclaw Skills 工作流。
Gemini Image Simple 工作原理
  1. 用户通过 Python 3 执行脚本,传递文本提示及可选的输入图像进行编辑。
  2. 该技能从环境变量中读取 GEMINI_API_KEY,以便向 Google AI 服务进行身份验证。
  3. 利用内置的 urllib.request 模块,该技能向 Gemini API 端点发送结构化的 JSON 负载。
  4. Google 的 Nano Banana Pro 模型处理提示词(以及源图像,如果提供的话)以生成新的视觉数据。
  5. 该技能接收 base64 编码的图像数据,使用原生 base64 库进行解码,并将最终文件写入指定的输出路径。

Gemini Image Simple 配置指南

要将其集成到您的 Openclaw Skills 设置中,请确保您拥有来自 Google AI Studio 的有效 API 密钥。如下设置您的环境变量:

export GEMINI_API_KEY='your_api_key_here'

然后,您可以使用任何 Python 3.10+ 环境立即运行该技能:

python3 scripts/generate.py "火星的电影级景观" mars.png

Gemini Image Simple 数据架构与分类体系

该技能主要通过标准文件系统输入和输出管理数据,无需外部数据库。

组件 详情
支持的输入 PNG, JPG, JPEG, GIF, WEBP
输出格式 生成标准 PNG 图像文件
依赖项 纯 Python 标准库 (urllib, json, base64)
模型 默认为 nano-banana-pro-preview (Gemini 3 Pro Image)
文件结构 脚本包含在 scripts/ 目录中以便模块化访问
name: gemini-image-simple
version: 1.1.0
description: Generate and edit images with Gemini API using pure Python stdlib. Zero dependencies - works on locked-down environments where pip/uv aren't available.
metadata:
  openclaw:
    emoji: "??"
    requires:
      env: ["GEMINI_API_KEY"]

Gemini Image Simple

Generate and edit images using Google's Nano Banana Pro (Gemini 3 Pro Image) - the highest quality image generation model.

Why This Skill

Feature This Skill Others (nano-banana-pro, etc.)
Dependencies None (stdlib only) google-genai, pillow, etc.
Requires pip/uv ? No ? Yes
Works on Fly.io free ? Yes ? Fails
Works in containers ? Yes ? Often fails
Image generation ? Full ? Full
Image editing ? Yes ? Yes
Setup complexity Just set API key Install packages first

Bottom line: This skill works anywhere Python 3 exists. No package managers, no virtual environments, no permission issues.

Quick Start

# Generate
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py "A cat wearing a tiny hat" cat.png

# Edit existing image  
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py "Make it sunset lighting" edited.png --input original.png

Usage

Generate new image

python3 {baseDir}/scripts/generate.py "your prompt" output.png

Edit existing image

python3 {baseDir}/scripts/generate.py "edit instructions" output.png --input source.png

Supported input formats: PNG, JPG, JPEG, GIF, WEBP

Environment

Set GEMINI_API_KEY environment variable. Get one at https://aistudio.google.com/apikey

How It Works

Uses Nano Banana Pro (nano-banana-pro-preview) - Google's highest quality image generation model:

  • Pure urllib.request for HTTP (no requests library)
  • Pure json for parsing (stdlib)
  • Pure base64 for encoding (stdlib)

That's it. No external packages. Works on any Python 3.10+ installation.

Model

Currently using: nano-banana-pro-preview (also known as Gemini 3 Pro Image)

Other available models (can be changed in generate.py if needed):

  • gemini-3-pro-image-preview - Same as Nano Banana Pro
  • imagen-4.0-ultra-generate-001 - Imagen 4.0 Ultra
  • imagen-4.0-generate-001 - Imagen 4.0
  • gemini-2.5-flash-image - Gemini 2.5 Flash with image gen

Examples

# Landscape
python3 {baseDir}/scripts/generate.py "Misty mountains at sunrise, photorealistic" mountains.png

# Product shot
python3 {baseDir}/scripts/generate.py "Minimalist product photo of a coffee cup, white background" coffee.png

# Edit: change style
python3 {baseDir}/scripts/generate.py "Convert to watercolor painting style" watercolor.png --input photo.jpg

# Edit: add element
python3 {baseDir}/scripts/generate.py "Add a rainbow in the sky" rainbow.png --input landscape.png