DeepSeek 开源周第二天：DeepEP 引领 MoE 模型通信效率革新

【旭才科技】今天是 DeepSeek 开源周的第二天，DeepSeek 团队如约发布了开源代码库 DeepEP，这是一款专为 MoE（Mixture of Experts）模型设计的 EP（Efficient Parallelism）通信库，它的出现为 MoE 模型的训练和推理提供了专门的通信工具，解决了大规模分布式 AI 训练和实时推理场景中效率低下的问题。

以下是 DeepEP 的一些技术性能特点简要介绍：

1. 高效通信架构：DeepEP 支持全对全通信模式的优化，实现了节点内和节点间的 NVLink 与 RDMA 互联，显著提升了数据传输的效率。

2. 多精度与调度优化：DeepEP 原生支持 FP8 低精度运算调度，有效降低计算资源的消耗。

3. 重性能内核：高吞吐量内核设计，适用于训练和推理预填充场景，最大化数据处理能力。

4. 低延迟内核：针对推理解码场景，采用纯 RDMA 通信和自适应路由技术，有效减少延迟。

5. 资源控制与重叠机制：通过灵活的 GPU 资源控制策略，实现计算与通信过程的高效重叠，避免资源闲置。

6. 深度优化场景：对 NVLink 到 RDMA 的非对称带宽转发场景进行专项优化，提升异构网络下的传输性能。

此外，DeepEP 还支持 SM（Streaming Multiprocessors）数量的动态控制，以平衡不同任务（如训练与推理）的吞吐量需求。（Suky）

马斯克预言 30 万亿美元的特斯拉机器人，怎么现在还是「手残」？

Apple Grapples With AI Talent Exodus as Tech Giants Compete for Top Researchers

债市日报：9 月 4 日

宁德时代和比亚迪电动汽车电池装车量在前 7 个月同比双双大增两家份额超过 50%

高德地图地铁导航功能全新升级推出下车智能提醒等功能

高盛乐观预测：中国股市仍有上涨空间

银河证券：9 月 A 股市场有望在流动性驱动下延续结构性行情

港股早报｜高盛乐观预测中国股市仍有上涨空间优必选获 2.5 亿元人形机器人采购合同

天津周六福黄金多少钱一克（2025 年 9 月 3 日）

纳斯达克 IPO 拟抬门槛中概股首发募资 2500 万美元起步

GDP 超预期也救不了澳元！多头昙花一现，空头已布好局

小红书估值飙升至 310 亿美元，三个月内增长 19%

马斯克「金色擎天柱」首曝，一双「真人手」刷屏

新华财经晚报：国务院办公厅印发《关于释放体育消费潜力进一步推进体育产业高质量发展的意见》

国产车布局超豪华，一场向上突围的持久战

沪深股指两连阴多头何时反击？

塞尔维亚总统：感谢中国领导人和中国人民的真挚友谊

消息称 DeepSeek 计划年底前发布 AI 智能体抢占下一代人机交互入口

全球纯电动汽车和插电式混合动力汽车在今年前 7 个月交付超过 1100 万辆

JOLTS 与非农双重考：美元还能否冲过 98.70？

黑马财经

DeepSeek 开源周第二天：DeepEP 引领 MoE 模型通信效率革新

推荐阅读