阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。
千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。
在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。
千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。
-
《四喜》等16部剧列入重点作品版权保护预警名单 网盘不能存
国家版权局最新公布了新一批重点作品版权保护预警名单,共包括16部电视剧、网络剧。其中,包括《四喜》《唐朝诡事录之长安》《低智商犯罪》等热播剧。根据规定,相关网络服务商应对版权保护预警名单内的重点作品采
-
iPhone 17 Pro Max成功破解运行iPadOS!体验神似Mac
虽然iOS和iPadOS在底层平台相似,但苹果一直限制iPhone用户使用iPad独有的多任务和桌面级功能。不过近日一位iPhone 17 Pro Max用户通过一个漏洞成功破解了这款手机,并使其运行
-
2nm机密保住了 台积电高管跳槽Intel伤害不大:1年前就已调离核心
75岁的台积电资深高管罗唯仁今年退休之后跳槽去了老东家Intel,此事引发行业关注,尤其是涉及台积电2nm、A16、A14等工艺核心机密。此前消息称,罗唯仁在退休前利用高级主管职权,要求员工制作并携带
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
关注网络尖刀微信公众号随时掌握互联网精彩

lucynana
