DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
DeepSeek致谢腾讯技术团队,这是一次“巨大的加速”代码贡献。
据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。
经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。
该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup(巨大的加速)”代码贡献。
据了解,自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。
在这些技术中,DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。
据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。
在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。
目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。
-
OPPO Find X9实拍人像样张出炉 周意保:哈苏画质王
OPPO Find系列负责人周意保表示,Find X9系列掀起画质革命,有三个大招:满血版LYT-828、哈苏真2亿以及哈苏8K超清照片,全焦段直出。他强调,Find X9全系都是哈苏画质王,绝不只是
-
小米17系列最高跑分出炉:与苹果iPhone 17 Pro势均力敌
今天小米17系列跑分信息陆续现身Geekbench数据库,目前已经出现了最佳成绩:单核3831,多核11525。小米17系列将首发搭载高通骁龙8 Elite Gen5,目前这个成绩已经与iPhone
-
又一职业危险了 无人环卫机器人开始大规模投用:效率提升近10倍
近日,无人环卫机器人在全国多地开启大规模商业化运营,其近10倍于人工的作业效率,悄然重塑环卫行业格局。广州计划2026年将无人清扫设备投用数提至1000台,杭州等城市则在新招标环卫项目中明确要求配备无
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩