Gemini脚本专题 | AI对话、文本生成与自动化调用全攻略

首页前沿速递服务器教程网页设计教程网络编辑教程

移动端

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

Gemini

本专题深入讲解Gemini脚本的设计与应用，涵盖智能对话、内容创作、代码生成、多模态处理等场景，支持自动化调用Gemini接口，帮助开发者与创作者高效集成AI能力到各类项目中。

文章

Dia-Arc团队发布AI原生浏览器深度融合强大AI功能 Dia-Arc团队发布的AI原生浏览器深度融合强大AI功能，基于Chromium架构提供智能写作辅助、多模式搜索和网页内容总结等核心功能。用户可通过语音交互和文件上传快速获取结构化答案，并利用分屏多任务处理提升效率。支持个性化定制响应风格和技能库扩展，适用于学术研究、商务办公等场景。目前仅限macOS 14+系统用户通过邀请码体验这款重新定义浏览体验的智能工具。

2026-03-28

Gemi

MultimodalLiveAPI谷歌发布多模态交互低延迟实时互动人工智能接口谷歌推出Multimodal Live API多模态交互接口，支持文本音频视频输入与低延迟实时互动，让AI对话更自然流畅。该API具备视频理解、会话记忆和功能调用能力，适用于在线教育、远程医疗和视频会议等场景。基于WebSocket协议和NLP技术，开发者可构建具有实时音视频流功能的应用程序。

2026-03-28

Gemi

谷歌推出FACTSGrounding基准测试评估大模型能力谷歌DeepMind推出FACTS Grounding基准测试，用于评估大型语言模型基于上下文生成事实准确文本的能力。该测试涵盖1719个多领域案例，要求模型处理长达32k token的文档并完成摘要问答等任务，通过两阶段评估检测模型是否产生幻觉。测试采用Gemini等主流模型验证，提升AI生成内容的可信度与应用价值。

2026-03-28

Gemi

OpenNotebook开源AI笔记工具一键转换多格式笔记为博客 OpenNotebook是一款开源AI笔记工具，支持多格式内容管理和智能笔记生成。作为注重隐私的NotebookLM替代方案，它集成了OpenAI和Anthropic等AI模型，提供多笔记本管理、播客转换和智能搜索功能。用户可通过自然语言处理技术快速整理学术资料、课堂笔记或创作内容，实现高效知识管理。该工具支持PDF、视频等多样化文件格式，适合研究人员、教育工作者和内容创作者使用。

2026-03-28

Gemi

MiniMax01MiniMax开源全新系列模型 MiniMax01是MiniMax开源的全新系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列采用线性注意力机制，参数量达4560亿，支持400万token超长上下文处理，性能媲美海外顶尖模型。提供高效API服务，适用于长文任务、多模态理解和复杂Agent系统构建，以极致性价比满足企业、教育及开发者需求。

2026-03-28

Gemi

斯坦福与华盛顿大学联合发布高效低成本AI推理模型s1 斯坦福大学与华盛顿大学联合研发的S1模型是一款高效低成本的AI推理模型，通过蒸馏技术从顶尖模型提取能力，仅需50美元和30分钟训练即可实现优异表现。S1在数学编程领域展现卓越推理能力，支持测试时动态调整计算量，并已开源代码与数据集。该模型适用于科学问题解答、智能辅导等场景，以极低成本提供高性能推理方案。

2026-03-28

Gemi

AlphaGeometry2谷歌DeepMind发布突破性AI系统可攻克高难度几何难题 AlphaGeometry2是谷歌DeepMind推出的突破性AI系统，专门攻克国际数学奥林匹克竞赛中的高难度几何问题。该系统结合神经符号方法，通过Gemini语言模型预测几何构造并配合符号引擎进行逻辑推理，解题率高达84%，超越金牌得主水平。其核心功能包括处理复杂几何问题、扩展问题覆盖范围，并应用于数学竞赛、教育和研究领域。

2026-03-28

Gemi

AnythingLLM-开源全栈AI客户端支持本地部署与API集成 AnythingLLM是一款开源全栈AI客户端，支持本地部署与API集成。该工具提供多模态交互功能，支持文本、图像和音频输入，能将文档转化为上下文供语言模型使用。具备工作区隔离、多用户管理、文档格式兼容等核心功能，数据默认本地存储确保隐私安全。适用于知识管理、学术研究、内容创作等场景，支持多种主流语言模型和向量数据库。

2026-03-28

Gemi

ClipSketchAI开源智能创作工具一键提取视频关键帧 ClipSketchAI是一款开源智能创作工具，专为视频创作者和社交媒体运营者设计。它能一键解析Bilibili和小红书视频链接，自动提取关键帧并转化为手绘风格故事板，同时生成适配社交媒体的文案。工具支持帧级标记、批量处理和本地部署，适用于短视频创作、剧情分镜制作等多种场景，帮助用户高效完成内容创作。

2026-03-28

Gemi

谷歌开源翻译模型TranslateGemma系列谷歌开源翻译模型TranslateGemma系列是基于Gemma 3开发的新一代多语言翻译工具，支持55种语言的高质量翻译。该系列提供4B、12B和27B三种参数规模，适配移动设备、笔记本和云端环境，具备高效性能和出色的多模态能力，可翻译图像文本。通过监督微调和强化学习优化，适用于个人交流、企业国际化和教育等领域。

2026-03-28

Gemi

商汤科技开源多模态自主推理模型SenseNova-MARS 商汤科技开源多模态自主推理模型SenseNova-MARS提供8B和32B两种参数规模，支持动态视觉推理与图文搜索深度融合。作为首个Agentic VLM模型，它可自主规划任务步骤，调用图像裁剪与搜索工具完成复杂多跳推理，在七大基准测试中超越主流模型。具备细粒度视觉分析和自主Agent执行能力，适用于体育分析、商业情报等场景。

2026-03-28

Gemi

面壁智能开源全双工全模态模型MiniCPM-o4.5 面壁智能开源全双工全模态模型MiniCPM-o4.5是一款9B参数旗舰模型，支持边看边听边说的即时自由对话。该模型融合视觉理解、超拟人语音生成与声音克隆能力，实现主动交互与实时流媒体处理，适配多种国产芯片与高效部署框架。MiniCPM-o4.5在智能助手、实时视频交互等场景展现卓越性能，提供端到端全模态架构设计与全双工实时流机制。

2026-03-28

Gemi

Nano Banana 2 国内使用指南 LiblibAI 无需翻墙教程 Nano Banana 2国内使用指南现已上线LiblibAI平台，无需翻墙即可体验这款谷歌最新发布的生图模型。Nano Banana 2兼具Pro版的高质量和Flash版的快速生成优势，价格仅为Pro版一半。LiblibAI提供一站式解决方案，包含丰富玩法模板和多种图像比例选择，支持从512px到4K的图像生成。用户可免费领取积分体验，享受93天免积分会员特权，轻松创作高质量图像内容。

2026-03-30

Gemi

Gemini2.0谷歌发布原生多模态输入输出以Agent为核心的AI模型 Gemini2.0是谷歌推出的新一代原生多模态AI模型，以Agent技术和多模态输入输出为核心。Gemini2.0 Flash作为首个子模型，速度比1.5 Pro快两倍，支持文本、音频和图像集成响应，具备实时音视频流处理和工具调用能力。该模型应用于编程助手Jules、数据分析等场景，提供多语言交互和智能任务执行，目前通过Google AI Studio免费开放API。

2026-03-20

Gemi

GeminiCoder-AI应用生成工具文本描述实时生成代码和预览 GeminiCoder是一款基于Gemini API的AI应用生成工具，通过Next.js和Tailwind CSS技术实现快速开发。用户输入简单描述即可自动生成完整Web应用代码，并借助Sandpack进行实时代码编辑与预览。支持多种Gemini模型，适用于原型开发、教育学习和小型应用构建，显著提升开发效率与可视化调试体验。

2026-03-20

Gemi

GeminiEmbedding谷歌最新文本嵌入模型 Gemini Embedding是谷歌推出的先进文本嵌入模型，可将文本转化为高维向量并捕捉语义信息。基于Gemini模型训练，支持100多种语言和8K长文本处理，适用于高效检索、文本分类和相似性检测等场景。该模型采用Matryoshka Representation Learning技术灵活调整维度，提升系统效率并优化存储成本，现已集成至Gemini API。

2026-03-21

Gemi

谷歌最新AI思考模型Gemini2.5Pro发布谷歌最新AI思考模型Gemini2.5 Pro正式发布，该模型具备深度推理能力，在回应前通过多步骤逻辑分析提升准确性和逻辑性。支持文本图像音频视频及代码的多模态输入，拥有100万token超大上下文窗口，擅长代码生成编辑与复杂任务处理。在LMArena等基准测试中表现卓越，适用于学术研究软件开发等跨领域场景。

2026-03-21

Gemi

GeminiFullstackLangGraphQuickstart_谷歌DeepMind开源全栈AI研究助手谷歌DeepMind开源Gemini Fullstack LangGraph Quickstart全栈AI研究助手，帮助开发者快速搭建基于Google Gemini 2.5和LangGraph的智能研究工具。支持动态搜索查询生成、网络研究、反思推理和迭代优化功能，整合信息生成带引用的综合答案。提供React前端和LangGraph后端，适用于学术研究、市场调研等场景，支持本地开发和Docker部署。

2026-03-21

Gemi

谷歌开源GeminiCLI编程工具免费使用Gemini2Pro5模型谷歌开源GeminiCLI编程工具免费提供Gemini2Pro5模型支持，助力开发者高效完成代码编写、错误修复及功能构建。该工具集成代码理解、文件操作与动态排查功能，内置谷歌搜索并支持MCP协议扩展。支持定制提示与自动化脚本集成，适用于软件开发、内容生成及学术研究等多场景，大幅提升工作效率。

2026-03-20

Gemi

Storybook谷歌Gemini打造智能绘本创作助手 Storybook是谷歌Gemini推出的智能绘本创作助手，支持用户通过简单描述生成个性化图画书。用户可定制主题、目标读者年龄和艺术风格，如粘土动画或水彩，生成包含专业插图和朗读旁白的绘本。该工具适用于儿童教育、睡前故事和语言学习等场景，帮助用户轻松创作生动有趣的教育内容。Storybook让绘本创作更智能便捷，提升阅读体验和教育效果。

2026-03-21

Gemi

«
1
2
3
4
5
6
»

热门专题

#Grok

Grok脚本资源网站，提供G

+ 收藏

#Sora2

Sora2脚本资源网站，提供S

+ 收藏

#通义万相

通义万相脚本资源网站，提供通

+ 收藏

#海螺AI

海螺AI脚本资源网站，提供海

+ 收藏

#可灵AI

可灵AI脚本资源网站，提供可

+ 收藏

#Kling3.0

Kling3.0脚本资源网站，提

+ 收藏

AI精选

更多

AI Agent 智能体 - Mu

RAG 不一定非得靠向量库：一

一文搞懂深度学习中的池化！

一文搞懂卷积神经网络经典架构-LeNet

告别 Vibe Coding：用 SDD 让 AI 编程提效 50%，三工具实战对比

Agent 语音交互如何更稳、更快？一次高并发消息链路优化实践

# AI 终于能"干活"了——Function Calling 完全指南

GSD 使用指南：高效交付功能的结构化工作流

刚刚！Claude最强大模型泄露，Anthropic紧急封锁

开源项目 superpowers 深度解读：把 AI Coding Agent 变成遵守工程流程的协作伙伴