DeepSeek 开源进度 2/5：首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP-脚本在线

首页前沿速递服务器教程网页设计教程网络编辑教程

移动端

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

DeepSeek 开源进度 2/5：首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

作者：互联网

2026-03-24

⼤语⾔模型脚本

2 月 25 日消息，DeepSeek 的“开源周”活动今日已经来到第二天，今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。

IT之家附开源地址：https://github.com/deepseek-ai/DeepEP

官方表示其具备如下特征：

高效优化的全到全通信方式
支持节点内外通信，兼容 NVLink 和 RDMA 技术
提供高吞吐量的内核，提升训练和推理前期填充效率
提供低延迟内核，优化推理解码速度
完全支持 FP8 数据格式调度
提供灵活的 GPU 资源管理，支持计算与通信的重叠执行

详细介绍的大意如下：

DeepEP 是一款专为混合专家（MoE）和专家并行（EP）设计的通信库，提供了高吞吐量和低延迟的 all-to-all GPU 内核，常用于 MoE 派发和合并操作。该库还支持低精度计算，包括 FP8。
为了与 DeepSeek-V3 论文中提出的组限制门控算法兼容，DeepEP 提供了一些针对不对称带宽转发优化的内核，比如将数据从 NVLink 域转发到 RDMA 域。这些优化的内核能够提供高吞吐量，适合用于训练和推理的预填充任务，同时支持 SM（流式多处理器）数量控制。
对于延迟敏感型的推理解码任务，DeepEP 提供了一套低延迟内核，采用纯 RDMA 技术以最大程度减少延迟。此外，该库还采用了一种基于 Hook 的通信与计算重叠方法，不会占用任何 SM 资源。

需求：

Hopper GPUs (may support more architectures or devices later)
Python 3.8 及以上版本
CUDA 12.3 及以上版本
PyTorch 2.1 及以上版本
使用 NVLink 进行节点间通信
基于 RDMA 网络的节点间通信

相关标签:

AI 大模型资讯

上一篇：RAG（五）BGE-M3，最流行的开源text embedding模型下一篇：推荐四款基于 .NET 开源、功能强大的 CMS 建站系统

相关推荐

赛博朋克 K-Pop 动画一段关于赛博朋克背景下复杂 K-Pop 舞蹈序列的详细动漫风格提示词。

2026-04-17

立即查看

冰川星球大逃亡一个关于冰冻星球动作场景的写实电影级提示词，讲述主角通过直升机从崩塌的冰川中逃生的故事。

2026-04-17

立即查看

皮克斯/迪士尼风格 X (Twitter) 个人资料卡片提示一个详细的提示，用于生成一张皮克斯/迪士尼风格的可爱、高细节 3D 动画图像。图像中，一个女孩自然地坐在 X (Twitter) 个人资料卡的底部边缘，用户界面元素清晰可见，强调暖光、景深和高分辨率。它使用一张输入图像作为人物特征的参考。

2026-04-17

立即查看

蝴蝶群化作空灵舞者循环动画这是一个为 Seedance 2.0 设计的稳定电影级提示词，描述了一群蝴蝶汇聚成一名舞者，随后再次破碎为蝴蝶，从而实现无缝循环的效果。

2026-04-17

立即查看

专题

#数据可视化

数据可视化（Data Visu

+ 收藏

#自然语言处理

自然语言处理（Natural

+ 收藏

#Excel公式

Excel公式就是：用函数 +

+ 收藏

#Excel技巧

Excel是日常生活中必不可

+ 收藏

#蛋仔派对

蛋仔派对最新官方活动、关卡速

+ 收藏

#人工智能

人工智能（AI），简单说，就

+ 收藏

最新数据

谷歌DeepMind首发AGI终极考纲！20万全球悬赏，撕下所有大模型伪装 AGI，究竟如何评判？刚刚，

从配置到防御：Amazon Shield 如何用主动分析重塑云上安全策略

分享五款开源、美观的 WinForm UI 控件库

开源纯 Python 后台管理系统，支持任务管理功能

一款基于 .NET 8 + Vue 开源的、企业级中后台权限管理系统

推荐四款开源且功能强大的内网穿透工具

The Flip：链上 Solana 投硬币游戏 - Openclaw Skills

百度热搜监控：实时趋势搜索分析 - Openclaw Skills

OpenClaw Shield：AI 智能体企业级安全扫描器 - Openclaw Skills

Parallax：开源自主AI操作系统，打造真正属于你的个人AI生态

相关文章

一天一个开源项目（第23篇）：PageLM - 开源 AI 教育平台，把学习材料变成互动资源

开源大模型涨价策略分析：Llama 3.5 与 GLM-5 的商业化博弈

每周AI论文速递（260209-260213）

anthropic-academy：RAG检索增强生成

90%程序员还在让 AI 补代码，1%已经在指挥 AI 军团

# 从 0 到 1：**黎跃春**详解 AI 智能体运用工程师的工程化方法

Memo Code 安全设计：子进程、命令防护与权限审批的统一方案

Samba WINS 漏洞利用与防御全解析

拒绝“盲盒式”编程：规范驱动开发（SDD）如何重塑 AI 交付

ComfyUI 的缓存架构和实现

AI精选

更多

赛博朋克 K-Pop 动画

冰川星球大逃亡

皮克斯/迪士尼风格 X (Twitter) 个人资料卡片提示

蝴蝶群化作空灵舞者循环动画

抱着泰迪熊的男士写实肖像

滑雪旅行自拍视角提示

天鹅绒运动服中的超逼真肖像

外卖配送狂奔电影感提示词

MCP协议设计与实现-第13章 Streamable HTTP：远程流式传输

从零开发一个 MCP 服务器 + OpenCode Skill：让 AI 学会审查你的代码

脚本推荐

SeeDance 2.0 Video Creator专区

OpenClaw AI专区

cowork专区

claude code skills专区