MiniMax推出新一代Agent大模型M2.7并首次公开模型自我进化路径-脚本在线

首页前沿速递服务器教程网页设计教程网络编辑教程

移动端

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

MiniMax推出新一代Agent大模型M2.7并首次公开模型自我进化路径

作者：互联网

2026-03-21

AI快讯

人工智能领域迎来重大突破，MiniMax最新发布的M2.7大模型开创性地实现了自我进化能力，标志着AI技术迈入新阶段。让我们深入解析这项前沿科技成果。

在涵盖多种编程语言的SWE-Pro测试中，M2.7展现卓越性能，以56.22%正确率与GPT-5.3-Codex持平；在Repo级代码生成基准VIBE-Pro上取得55.6%得分，接近Opus 4.6水平。

M2.7的核心突破在于构建了完整的Agent Harness体系，整合Agent Teams、复杂Skills和Tool Search tool等模块，实现高度复杂的生产力任务自动化处理。在研发过程中，该模型自主构建了数十个强化学习skills，通过更新记忆系统驱动自身优化，形成独特的自我进化闭环。

在实际应用层面，M2.7在软件工程领域表现突出：

端到端项目交付能力显著提升，在VIBE-Pro测试中达到55.6%准确率
复杂工程系统理解深度增强，Terminal Bench 2测试得分57.0%
线上故障排查效率大幅提高，平均恢复时间缩短至3分钟内

专业办公场景同样取得突破性进展：

GDPval-AA评测ELO得分1495，位列开源模型首位
Office三件套编辑能力提升，支持多轮高保真修改
复杂skills遵循率高达97%，Toolathon测试正确率46.3%

构建模型自我进化智能体

M2.7的自我进化机制基于研究型Agent框架实现，该系统整合数据流水线、训练环境、评测基础设施等模块。以RL实验为例，模型可自主完成文献调研、实验监控、问题排查等全流程工作，承担30-50%的工作量。

在优化过程中，M2.7展示了惊人的自主迭代能力：

执行完整优化循环超过100轮
发现采样参数最优组合等关键优化点
内部评测集效果提升30%

通过短时记忆、自反馈和自优化三模块协同工作，M2.7在MLE Bench Lite测试中平均获得66.6%得牌率，与Gemini-3.1持平。

真实的软件工程

M2.7在编程能力方面实现质的飞跃：

SWE-Pro测试56.22%正确率
SWE Multilingual得分76.5
Multi SWE Bench准确率52.7%

特别在复杂系统理解方面：

Terminal Bench 2得分57.0%
NL2Repo测试39.8%准确率

Agent Teams功能突破显著：

实现角色边界清晰划分
支持对抗性推理
确保协议严格遵循

专业办公

在金融领域应用中，M2.7可自主完成：

研报阅读与分析
营收预测模型构建
专业文档自动生成

测试案例显示，M2.7能：

交叉比对多篇研报
独立设计假设
输出可直接使用的初稿

互动娱乐

M2.7在人设保持和对话能力方面取得突破：

开发OpenRoom交互系统
实现万物皆可互动的Web GUI空间
支持实时视觉反馈与场景交互

在MM-Claw测试中达到62.7%正确率，接近Sonnet 4.6水平。

从软件工程到专业办公，再到互动娱乐，M2.7大模型展现了全方位的卓越能力，为人工智能技术的发展开辟了崭新路径，其自我进化特性更预示着AI技术未来无限可能。

相关标签:

MiniMax 大模型

上一篇：IDC预测2025年全球人形机器人出货量将达1.8万台由中国厂商主导下一篇：IronClaw由NearAI团队开源的本土安全AI助手

相关推荐

技能收益追踪器：监控 Openclaw 技能并实现变现什么是技能收益追踪器？技能收益追踪器是一款专业级实用工具，旨在弥合 AI 开发与经济可持续性之间的鸿沟。随着开发者开始将作品变现，该工具提供了必要的基础设施，用于监控 ClawHub、EvoMap 和

2026-03-30

立即查看

信号管道：自动化营销情报工具 - Openclaw Skills 什么是信号管道？信号管道是一个复杂的数据采集和内容合成工具，旨在将碎片化的数字噪音转化为结构化的营销情报。作为 Openclaw Skills 的多功能组件，该系统坚控高价值来源，包括 RSS 订阅、X

2026-03-30

立即查看

AI 合规准备就绪度：评估与治理工具 - Openclaw Skills 什么是 AI 合规准备就绪度？此技能为组织提供了一个全面的框架，用于从八个关键维度评估其 AI 合规态势。它通过分析风险分类、偏差缓解和数据来源，弥合了技术 AI 部署与复杂监管要求之间的差距。利用这些 O

2026-03-30

立即查看

FOSMVVM ServerRequest 测试生成器：自动化 API 测试 - Openclaw Skills 什么是 FOSMVVM ServerRequest 测试生成器？ FOSMVVM ServerRequest 测试生成器是 Openclaw Skills 生态系统中的专用工具，旨在简化服务端 Swift 单元

2026-03-30

立即查看

专题

#Grok

Grok脚本资源网站，提供G

+ 收藏

#Sora2

Sora2脚本资源网站，提供S

+ 收藏

#通义万相

通义万相脚本资源网站，提供通

+ 收藏

#海螺AI

海螺AI脚本资源网站，提供海

+ 收藏

#可灵AI

可灵AI脚本资源网站，提供可

+ 收藏

#Kling3.0

Kling3.0脚本资源网站，提

+ 收藏

最新数据

小红书开源语音识别模型FireRedASR2S 小红书开源语音识别模型Fir

ClawFeed-开源AI新闻摘要工具智能生成结构化摘要

MoChat由港大开源打造的AI智能体社交平台

IronClaw由NearAI团队开源的本土安全AI助手

IDC预测2025年全球人形机器人出货量将达1.8万台由中国厂商主导

英伟达黄仁勋畅谈龙虾OpenClaw堪称人类史上规模最大最受欢迎最成功的开源项目必将成为下一个ChatGPT

广西完成首例脑机接口手术59岁帕金森患者术后恢复良好

夸克AI眼镜全系列焕新升级S1新增直播功能G1搭载超级夜景模式

Meta内部论坛被失控AI越权发帖并乱给代码惨遭背刺

消息称乐奇Rokid将推新一代AI智能体眼镜联合国内头部大模型公司打造

相关文章

Elasticsearch93新增bfloat16向量支持

解析OceanBase生态工具链之OAT_obd_OCP_obshell

贝叶斯不确定性引导的早停框架ESTune与OceanBase校企联合研究

杈炬ⅵ&浜哄ぇ閲戜粨閫傞厤瀹炴垬锛歋eaTunnel鍦ㄤ俊鍒涙暟鎹钩鍙颁腑鐨勫簲鐢ㄤ笌韪╁潙鎬荤粨

2026年1月中国数据库流行度排行榜：OB连冠领跑贺新元PolarDB跃居次席显锐气

社区译文解析FUD与真相MySQL是否真的被弃用了

英伟达重新规划AI推理加速布局暂停Rubin CPU转攻Groq LPU

gpress v1.2.2 全新上线 Web3内容平台迎来更新

CMake 4.3.0 正式推出

短剧采用AI换脸技术使角色酷似明星制作方与播出方构成侵权

AI精选

更多

MCP 协议深度解析：构建 A

OpenClaw 真正的效率开

Anthropic 的 Harness 启示：当 AI Agent 开始「长跑」，架构才是真正的天花板

AI Agent 智能体 - Multi-Agent 架构入门

RAG 不一定非得靠向量库：一套更偏工程落地的“结构化推理检索”方案

一文搞懂深度学习中的池化！

一文搞懂卷积神经网络经典架构-LeNet

告别 Vibe Coding：用 SDD 让 AI 编程提效 50%，三工具实战对比

Agent 语音交互如何更稳、更快？一次高并发消息链路优化实践

# AI 终于能"干活"了——Function Calling 完全指南

脚本推荐

SeeDance 2.0 Video Creator专区

OpenClaw AI专区

cowork专区

claude code skills专区