XiaomiMiMoV2ProOmniTTS正式发布

作者:互联网

2026-03-21

AI快讯

小米近日发布三款重磅大模型产品,包括MiMo-V2-Pro、Omni和TTS,标志着其在人工智能领域的重大突破。

Xiaomi MiMo-V2-Pro专为高强度Agent工作场景设计,具备42B激活参数和1T总参数量,采用混合注意力架构,支持1M超长上下文处理。该模型在Artificial Analysis全球大模型排行榜中位列第八,国内排名第二。在OpenClaw和Claude Code等框架测试中,其展现出卓越的任务完成能力,能自主处理复杂工作流编排、长期规划和精准工具调用。性能方面已超越Claude Sonnet 4.6,接近Opus 4.6水平,而API定价仅为后者的五分之一。

MiMo-V2-Omni专注于多模态交互场景,创新性地构建了融合文本、视觉和语音的全模态基座,实现感知与行动的深度整合。该模型兼容各类Agent框架,现已开放API服务,支持256K上下文长度,定价为输入0.4美元/百万tokens,输出2美元/百万tokens。

Xiaomi MiMo-V2-TTS作为自主研发的语音合成模型,采用Audio Tokenizer和多码本联合建模架构。经过上亿小时语音数据训练,该模型实现了精准的语音风格控制,支持从整体风格到局部情感的多层次调节,能自然还原人类说话的韵律特征,在歌唱场景中也能准确表现音高节奏。其训练过程分为大规模预训练和强化学习两个阶段,通过多层码本建模架构保留了原始语音的丰富信息,使模型在韵律、音质、表达准确性等方面均达到行业领先水平。

这三款大模型的发布展现了小米在人工智能领域的技术实力,为开发者提供了更智能、更经济的AI解决方案。

相关标签:

Xiaomi MiMo-V2-Pro & Omni & TTS 发布