消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达
据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。
报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
-
哪吒汽车管理人回应车联网服务停机:联想懂的单方面终止服务
今日,合众新能源(哪吒汽车实体公司)管理人发布《哪吒汽车车联网服务停机声明》称,管理人自接管哪吒汽车后,积极履行与广东联想懂的通信有限公司(以下简称“联想懂的”)签订的《分期支付协议》及《车联网服务协
-
国内首款eSIM手机 iPhone Air预售:5.6毫米史上最薄iPhone 7999元起
今晚8点,iPhone Air将正式开启预售,起售价7999元,该机轻165克,厚度仅5.6毫米,是苹果迄今最薄的iPhone。为了极致轻薄,iPhone Air没有实体SIM卡槽,使用的是eSIM技
-
高德地图发布代言人剪影图 网友看拿筷方式猜测是王鹤棣 并喊“复婚成功”
据媒体报道,此前有网友爆料,阿里全球总部此前未启用的C4楼,被用于一个高级别的全新项目。新项目组单独进驻,完全封闭办公模式,设置额外门禁权限,甚至配了独立安保。项目组已入驻两个多月,却鲜有人知晓具体情
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩