消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达

互联网 来源:快科技 2025-04-29 09:23:56

据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。

报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。

据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。

延伸阅读
  • 智元机器人获得国际集团入股 LG电子等领投

    据媒体报道,智元机器人近日完成新一轮战略融资,全球消费电子巨头LG电子与韩国未来资产集团联合领投此次投资。值得关注的是,这是LG电子在具身智能领域的首次全球战略布局,标志着国际资本对中国机器人赛道的高

  • Arm宣布正在自研芯片 Meta等巨头抢先试用

    据媒体报道,芯片架构提供商Arm Holdings首席执行官Rene Haas宣布,公司正加大投入开发自有芯片产品,此举标志着其从传统IP授权模式向提供实体芯片的战略重大转变。Haas表示,这些成品芯

  • 腾讯重拳打击DMA外挂!《三角洲行动》宣布CPU虚拟化正式接入AMD平台

    日前,腾讯射击游戏《三角洲行动》宣布,CPU虚拟化反作弊功能正式接入AMD平台,实现主流CPU平台覆盖。7月10日,《三角洲行动》CPU虚拟化反作弊功能率先在Intel平台生效,自虚拟化功能上线后,已

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
内容推荐