DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
DeepSeek致谢腾讯技术团队,这是一次“巨大的加速”代码贡献。
据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。
该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup(巨大的加速)”代码贡献。
据了解,自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。
在这些技术中,DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。
据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。
在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。
目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。
- 
                                    
阿里前高管空降山姆引热议:APP被吐槽变得“盒马化”
今日,“山姆变得像盒马”话题冲上微博热搜第二。而让网友反应如此激烈,则是源于一次山姆的人事变动。上月底,沃尔玛中国宣布,前阿里巴巴高管刘鹏加入沃尔玛中国并担任山姆会员店业态总裁。而在刘鹏空降后,山姆A
 - 
                                    
美团把外卖送到南半球 巴西第一单配送不到10分钟
近日,美团旗下国际外卖品牌Keeta正式开启在巴西的运营,于圣保罗州的桑托斯和圣维森特上线。第一笔外卖订单出现在桑托斯市,一男子在下单9分42秒后,便收到了其购买的双份布朗尼蛋糕。接下来,Keeta将
 - 
                                    
黄仁勋称NVIDIA退出中国市场!华为、沐曦、摩尔线程等国产GPU接棒
“NVIDIA在中国市场的份额已经从之前的95%骤降至0,目前我们已经完全退出了中国市场。”最近,由美国城堡证券(CitadelSecurities)组织的一次活动中,NVIDIA CEO黄仁勋发表了
 
关注公众号:拾黑(shiheibook)了解更多
友情链接:
                        关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
                        安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
                    
            关注网络尖刀微信公众号随时掌握互联网精彩
- 《炉石传说》国服回归!《魔兽世界》联动活动来了:坐骑免费送
 - 《英雄联盟》设计师:相比于点燃 TP太强了我很讨厌
 - 《阴间大法师2》曝新海报 那个黑白条纹身影又回来了
 - 威联通(QNAP)推出全新双端口 25GbE SFP28 网络扩充卡
 - 李彦宏为什么会被评为“全球AI领袖”?
 - Start8 9.1.1.0最新版本2022下载地址
 - 长沙兽livehouse开福东风路店酒吧消费
 - 小鹿百度推广竞价软件 1.1.1203.5841最新版本2022下载地址
 - 鹏保宝官方版 v5.3.1最新版本2022下载地址
 - 兴盛电商 v3.0.02最新版本2022下载地址
 - QQ导航 6.0.0.0最新版本2022下载地址
 - 画质解锁 v1.0最新版本2022下载地址
 

                





                水牛影视
            
                
                
                