Gemini
本专题深入讲解Gemini脚本的设计与应用,涵盖智能对话、内容创作、代码生成、多模态处理等场景,支持自动化调用Gemini接口,帮助开发者与创作者高效集成AI能力到各类项目中。
文章
Dia-Arc团队发布AI原生浏览器深度融合强大AI功能
Dia-Arc团队发布的AI原生浏览器深度融合强大AI功能,基于Chromium架构提供智能写作辅助、多模式搜索和网页内容总结等核心功能。用户可通过语音交互和文件上传快速获取结构化答案,并利用分屏多任务处理提升效率。支持个性化定制响应风格和技能库扩展,适用于学术研究、商务办公等场景。目前仅限macOS 14+系统用户通过邀请码体验这款重新定义浏览体验的智能工具。
2026-03-28
Gemi
MultimodalLiveAPI谷歌发布多模态交互低延迟实时互动人工智能接口
谷歌推出Multimodal Live API多模态交互接口,支持文本音频视频输入与低延迟实时互动,让AI对话更自然流畅。该API具备视频理解、会话记忆和功能调用能力,适用于在线教育、远程医疗和视频会议等场景。基于WebSocket协议和NLP技术,开发者可构建具有实时音视频流功能的应用程序。
2026-03-28
Gemi
谷歌推出FACTSGrounding基准测试评估大模型能力
谷歌DeepMind推出FACTS Grounding基准测试,用于评估大型语言模型基于上下文生成事实准确文本的能力。该测试涵盖1719个多领域案例,要求模型处理长达32k token的文档并完成摘要问答等任务,通过两阶段评估检测模型是否产生幻觉。测试采用Gemini等主流模型验证,提升AI生成内容的可信度与应用价值。
2026-03-28
Gemi
OpenNotebook开源AI笔记工具一键转换多格式笔记为博客
OpenNotebook是一款开源AI笔记工具,支持多格式内容管理和智能笔记生成。作为注重隐私的NotebookLM替代方案,它集成了OpenAI和Anthropic等AI模型,提供多笔记本管理、播客转换和智能搜索功能。用户可通过自然语言处理技术快速整理学术资料、课堂笔记或创作内容,实现高效知识管理。该工具支持PDF、视频等多样化文件格式,适合研究人员、教育工作者和内容创作者使用。
2026-03-28
Gemi
MiniMax01MiniMax开源全新系列模型
MiniMax01是MiniMax开源的全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列采用线性注意力机制,参数量达4560亿,支持400万token超长上下文处理,性能媲美海外顶尖模型。提供高效API服务,适用于长文任务、多模态理解和复杂Agent系统构建,以极致性价比满足企业、教育及开发者需求。
2026-03-28
Gemi
斯坦福与华盛顿大学联合发布高效低成本AI推理模型s1
斯坦福大学与华盛顿大学联合研发的S1模型是一款高效低成本的AI推理模型,通过蒸馏技术从顶尖模型提取能力,仅需50美元和30分钟训练即可实现优异表现。S1在数学编程领域展现卓越推理能力,支持测试时动态调整计算量,并已开源代码与数据集。该模型适用于科学问题解答、智能辅导等场景,以极低成本提供高性能推理方案。
2026-03-28
Gemi
AlphaGeometry2谷歌DeepMind发布突破性AI系统可攻克高难度几何难题
AlphaGeometry2是谷歌DeepMind推出的突破性AI系统,专门攻克国际数学奥林匹克竞赛中的高难度几何问题。该系统结合神经符号方法,通过Gemini语言模型预测几何构造并配合符号引擎进行逻辑推理,解题率高达84%,超越金牌得主水平。其核心功能包括处理复杂几何问题、扩展问题覆盖范围,并应用于数学竞赛、教育和研究领域。
2026-03-28
Gemi
AnythingLLM-开源全栈AI客户端支持本地部署与API集成
AnythingLLM是一款开源全栈AI客户端,支持本地部署与API集成。该工具提供多模态交互功能,支持文本、图像和音频输入,能将文档转化为上下文供语言模型使用。具备工作区隔离、多用户管理、文档格式兼容等核心功能,数据默认本地存储确保隐私安全。适用于知识管理、学术研究、内容创作等场景,支持多种主流语言模型和向量数据库。
2026-03-28
Gemi
ClipSketchAI开源智能创作工具一键提取视频关键帧
ClipSketchAI是一款开源智能创作工具,专为视频创作者和社交媒体运营者设计。它能一键解析Bilibili和小红书视频链接,自动提取关键帧并转化为手绘风格故事板,同时生成适配社交媒体的文案。工具支持帧级标记、批量处理和本地部署,适用于短视频创作、剧情分镜制作等多种场景,帮助用户高效完成内容创作。
2026-03-28
Gemi
谷歌开源翻译模型TranslateGemma系列
谷歌开源翻译模型TranslateGemma系列是基于Gemma 3开发的新一代多语言翻译工具,支持55种语言的高质量翻译。该系列提供4B、12B和27B三种参数规模,适配移动设备、笔记本和云端环境,具备高效性能和出色的多模态能力,可翻译图像文本。通过监督微调和强化学习优化,适用于个人交流、企业国际化和教育等领域。
2026-03-28
Gemi
商汤科技开源多模态自主推理模型SenseNova-MARS
商汤科技开源多模态自主推理模型SenseNova-MARS提供8B和32B两种参数规模,支持动态视觉推理与图文搜索深度融合。作为首个Agentic VLM模型,它可自主规划任务步骤,调用图像裁剪与搜索工具完成复杂多跳推理,在七大基准测试中超越主流模型。具备细粒度视觉分析和自主Agent执行能力,适用于体育分析、商业情报等场景。
2026-03-28
Gemi
面壁智能开源全双工全模态模型MiniCPM-o4.5
面壁智能开源全双工全模态模型MiniCPM-o4.5是一款9B参数旗舰模型,支持边看边听边说的即时自由对话。该模型融合视觉理解、超拟人语音生成与声音克隆能力,实现主动交互与实时流媒体处理,适配多种国产芯片与高效部署框架。MiniCPM-o4.5在智能助手、实时视频交互等场景展现卓越性能,提供端到端全模态架构设计与全双工实时流机制。
2026-03-28
Gemi
Nano Banana 2 国内使用指南 LiblibAI 无需翻墙教程
Nano Banana 2国内使用指南现已上线LiblibAI平台,无需翻墙即可体验这款谷歌最新发布的生图模型。Nano Banana 2兼具Pro版的高质量和Flash版的快速生成优势,价格仅为Pro版一半。LiblibAI提供一站式解决方案,包含丰富玩法模板和多种图像比例选择,支持从512px到4K的图像生成。用户可免费领取积分体验,享受93天免积分会员特权,轻松创作高质量图像内容。
2026-03-30
Gemi
Gemini2.0谷歌发布原生多模态输入输出以Agent为核心的AI模型
Gemini2.0是谷歌推出的新一代原生多模态AI模型,以Agent技术和多模态输入输出为核心。Gemini2.0 Flash作为首个子模型,速度比1.5 Pro快两倍,支持文本、音频和图像集成响应,具备实时音视频流处理和工具调用能力。该模型应用于编程助手Jules、数据分析等场景,提供多语言交互和智能任务执行,目前通过Google AI Studio免费开放API。
2026-03-20
Gemi
GeminiCoder-AI应用生成工具文本描述实时生成代码和预览
GeminiCoder是一款基于Gemini API的AI应用生成工具,通过Next.js和Tailwind CSS技术实现快速开发。用户输入简单描述即可自动生成完整Web应用代码,并借助Sandpack进行实时代码编辑与预览。支持多种Gemini模型,适用于原型开发、教育学习和小型应用构建,显著提升开发效率与可视化调试体验。
2026-03-20
Gemi
GeminiEmbedding谷歌最新文本嵌入模型
Gemini Embedding是谷歌推出的先进文本嵌入模型,可将文本转化为高维向量并捕捉语义信息。基于Gemini模型训练,支持100多种语言和8K长文本处理,适用于高效检索、文本分类和相似性检测等场景。该模型采用Matryoshka Representation Learning技术灵活调整维度,提升系统效率并优化存储成本,现已集成至Gemini API。
2026-03-21
Gemi
谷歌最新AI思考模型Gemini2.5Pro发布
谷歌最新AI思考模型Gemini2.5 Pro正式发布,该模型具备深度推理能力,在回应前通过多步骤逻辑分析提升准确性和逻辑性。支持文本图像音频视频及代码的多模态输入,拥有100万token超大上下文窗口,擅长代码生成编辑与复杂任务处理。在LMArena等基准测试中表现卓越,适用于学术研究软件开发等跨领域场景。
2026-03-21
Gemi
GeminiFullstackLangGraphQuickstart_谷歌DeepMind开源全栈AI研究助手
谷歌DeepMind开源Gemini Fullstack LangGraph Quickstart全栈AI研究助手,帮助开发者快速搭建基于Google Gemini 2.5和LangGraph的智能研究工具。支持动态搜索查询生成、网络研究、反思推理和迭代优化功能,整合信息生成带引用的综合答案。提供React前端和LangGraph后端,适用于学术研究、市场调研等场景,支持本地开发和Docker部署。
2026-03-21
Gemi
热门专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
AI精选


