XiaomiMiMoV2ProOmniTTS正式发布
作者:互联网
2026-03-21
小米近日发布三款重磅大模型产品,包括MiMo-V2-Pro、Omni和TTS,标志着其在人工智能领域的重大突破。
Xiaomi MiMo-V2-Pro专为高强度Agent工作场景设计,具备42B激活参数和1T总参数量,采用混合注意力架构,支持1M超长上下文处理。该模型在Artificial Analysis全球大模型排行榜中位列第八,国内排名第二。在OpenClaw和Claude Code等框架测试中,其展现出卓越的任务完成能力,能自主处理复杂工作流编排、长期规划和精准工具调用。性能方面已超越Claude Sonnet 4.6,接近Opus 4.6水平,而API定价仅为后者的五分之一。

MiMo-V2-Omni专注于多模态交互场景,创新性地构建了融合文本、视觉和语音的全模态基座,实现感知与行动的深度整合。该模型兼容各类Agent框架,现已开放API服务,支持256K上下文长度,定价为输入0.4美元/百万tokens,输出2美元/百万tokens。

Xiaomi MiMo-V2-TTS作为自主研发的语音合成模型,采用Audio Tokenizer和多码本联合建模架构。经过上亿小时语音数据训练,该模型实现了精准的语音风格控制,支持从整体风格到局部情感的多层次调节,能自然还原人类说话的韵律特征,在歌唱场景中也能准确表现音高节奏。其训练过程分为大规模预训练和强化学习两个阶段,通过多层码本建模架构保留了原始语音的丰富信息,使模型在韵律、音质、表达准确性等方面均达到行业领先水平。
这三款大模型的发布展现了小米在人工智能领域的技术实力,为开发者提供了更智能、更经济的AI解决方案。
相关标签:
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
Elasticsearch93新增bfloat16向量支持
解析OceanBase生态工具链之OAT_obd_OCP_obshell
贝叶斯不确定性引导的早停框架ESTune与OceanBase校企联合研究
杈炬ⅵ&浜哄ぇ閲戜粨閫傞厤瀹炴垬锛歋eaTunnel鍦ㄤ俊鍒涙暟鎹钩鍙颁腑鐨勫簲鐢ㄤ笌韪╁潙鎬荤粨
2026年1月中国数据库流行度排行榜:OB连冠领跑贺新元PolarDB跃居次席显锐气
社区译文解析FUD与真相MySQL是否真的被弃用了
英伟达重新规划AI推理加速布局 暂停Rubin CPU转攻Groq LPU
gpress v1.2.2 全新上线 Web3内容平台迎来更新
CMake 4.3.0 正式推出
短剧采用AI换脸技术使角色酷似明星 制作方与播出方构成侵权
AI精选
