消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达
据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。
报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
-
贝恩资本拟40亿美元出售中国数据中心业务
据媒体报道,美国投资公司贝恩资本(Bain Capital)正寻求出售旗下数据中心运营商WinTriX DC Group的中国业务,交易估值或超40亿美元(约合人民币289.67亿元)。据知情人士透露
-
《GTA6》封面女郎会是谁 网友热议:让悉尼妹来!
随着《GTA6》全新预告以及大量情报公开,玩家们开始讨论一个新问题:本作的封面女郎是谁?封面女郎一直是《GTA》系列的经典元素,从世纪初的《GTA3》开始,每一部正传作品都以一名风格独特的女郎作为封面
-
滴滴新功能干崩女司机:恶意投诉暴增 凭什么这苦要让我们女司机来吃
滴滴出行平台前段时间上线了“可选女司机”功能,该功能仅面向实名女性用户开放,女乘客在打车时可选择女司机来服务。这一功能明面上来看,能够提升女乘客打车出行时的安全体验,和女性司机的订单收入。但令人没想到
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/