XiaomiRobotics0小米开源机器人VLA模型
作者:互联网
2026-03-21
Xiaomi-Robotics-0作为开源首代机器人VLA大模型,通过47亿参数与创新架构实现自然语言理解与精准动作控制,在工业与家庭场景展现卓越性能。
Xiaomi-Robotics-0是什么
这款由小米开源的机器人模型采用MoT混合架构,以Qwen3-VL多模态模型处理视觉语言指令,配合Diffusion Transformer生成高频动作。其独创的异步执行机制与Λ-shape注意力掩码技术,有效解决动作卡顿问题,在LIBERO等测试中刷新记录,并成功应用于实际双臂操作任务。

Xiaomi-Robotics-0的主要功能
- 自然语言理解:能够准确解析模糊指令,识别视觉输入中的空间关系和操作意图。
- 动作生成控制:可输出高频平滑的动作序列,确保机器人完成精确物理操作。
- 实时异步执行:通过推理与执行并行机制,消除延迟现象,保证动作连贯性。
- 双臂协同操作:支持双手配合完成积木拆解等复杂任务,提升操作效率。
- 自适应策略调整:在抓取失败或环境变化时,能自动切换动作策略灵活应对。
- 多模态能力保持:保留视觉问答等通用理解能力,避免关键功能遗忘。
Xiaomi-Robotics-0的技术原理
- MoT混合架构:结合Qwen3-VL-4B多模态模型与Diffusion Transformer,实现47亿参数下的精准控制。
- 两阶段训练:先通过Action Proposal机制对齐特征空间,再专项训练DiT生成精确动作序列。
- 异步执行机制:通过Clean Action Prefix技术确保轨迹连续性,消除推理延迟影响。
- Λ-shape注意力掩码:改进传统注意力机制,提升模型对环境变化的反应速度。
Xiaomi-Robotics-0的项目地址
- 项目官网:https://xiaomi-robotics-0.github.io/
- GitHub仓库:https://github.com/XiaomiRobotics/Xiaomi-Robotics-0
- HuggingFace模型库:https://huggingface.co/collections/XiaomiRobotics/xiaomi-robotics-0
- 技术论文:https://xiaomi-robotics-0.github.io/assets/paper.pdf
Xiaomi-Robotics-0的应用场景
- 工业精密装配:适用于电子产品等精密组装,可处理20块积木的复杂结构。
- 家庭服务清洁:通过毛巾操作与物品识别能力,提升家务辅助效率。
- 物流仓储分拣:适应多样化商品处理需求,提高分拣精准度。
- 科研教育开发:为高校与研究机构提供算法研究平台。
- 商业交互展示:通过流畅人机协作展示技术实力,提升品牌形象。
Xiaomi-Robotics-0凭借创新架构与强大性能,为机器人控制领域带来突破性进展,在多个行业展现广阔应用前景。
相关标签:
AI工具
AI项目和工具
相关推荐
专题
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
+ 收藏
最新数据
相关文章
京东开源指令引导图像编辑模型JoyAI Image Edit
04/03
Claude Code五十一万行源代码突发泄露事件 从map文件失误看人工智能工程的重要启示
04/02
MCP伪需求剖析与CLI核心价值探讨
04/02
教育携手AI新时代 OPC与零代码智能体私董会首期成功举办
04/02
F2LLMv2震撼发布 全尺寸超高效多语嵌入模型横扫11项榜单SOTA创下性能新高峰
04/01
AnyClaw 开源智能转接头为AI Agent量身打造
04/01
Star Office UI 开源人工智能可视化看板展示Agent实时工作状态
04/01
AI领域日新月异 Harness如今已是寻常概念
04/01
Lark CLI 飞书开源的命令行工具 助力Agent高效操作飞书
04/01
商汤科技发布AI语音开放平台SenseAudio
04/01
AI精选
