谷歌发布Gemini 3.1 Ultra 200万Token原生跨模态推理能力全面上线
作者:互联网
2026-04-07
谷歌DeepMind正式发布Gemini 3.1 Ultra,是其本年度最重要的模型更新,支持200万Token的超长上下文窗口,并能在文本、图像、音频与视频之间进行原生跨模态推理。

无需转录的真正多模态
与以往依赖语音转文字、视频转字幕等中间步骤的方案不同,Gemini 3.1 Ultra从训练阶段就被设计为可以同时在多种模态之间直接推理。这意味着模型可以同时理解视频画面与背景音乐、根据图表与配套说明提出复杂分析。

沙盒代码执行环境集成
新版本还内置沙盒化的代码执行工具,模型可在对话过程中即时编写和测试代码,并将结果回填到回答中。与此同时,谷歌通过更强的检索接地能力进一步降低了事实性问题的幻觉率。
- 上下文窗口:200万Token
- 原生支持文本、图像、音频、视频
- 内置代码执行沙盒
相关标签:
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
Chaos Lab: 多智能体 AI 对齐研究框架 - Openclaw Skills
阿里云、本地部署OpenClaw多Agent协同、集成飞书、配置大模型:从0到1打造AI创作团队效流程
2026 OpenClaw 最新安装指南:Windows 一键部署,新手零门槛上手
【保姆级教程】阿里云计算巢部署OpenClaw、接入iMessage、配置大模型千问 Coding Plan指南
重复性工作中如何培养匠心
阿里云服务器ECS部署 OpenClaw、集成百炼Coding Plan、接入Slack喂饭级图文流程
MiniMax M2.7开源: 模型开始迭代自己了!
把RAG融入模型,开源MSA记住1亿Token实现永久记忆
SWE bench,彻底废了!伯克利团队推出AI基准终结者!10行代码,所有基准都拿下满分!网友:奖励黑客!
使用 Claude Code 与 Marp 构建高效演示文稿工作流
AI精选
