阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。
千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。
作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。
在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。
千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。
-
华为Mate 80将搭载侧边超声波指纹 大概率12月上市
近日,有数码博主爆料称,华为Mate 80系列有望搭载自研侧边超声波指纹技术。若属实,将是华为在生物识别领域的重要突破。据博主透露,华为侧边超声波指纹技术正在推进,预计下半年进入试产阶段。此前,华为因
-
《寻秦记》宣布2025贺岁档上映 古天乐等原班人马回归
据“中国电影报道”官微,今日,电影版《寻秦记》亮相第27届全国影片推介会,将于2025年贺岁档上映。该片延续剧版《寻秦记》的剧情,讲述承接剧版结局19年后的故事,影片集结了2001年剧版原班人马,包括
-
玄戒O1被严重低估了 雷军:不少人觉得做芯片很容易 其实这个过程非常艰难
今天下午,小米创办人雷军发文表示,我们这次发布大芯片,不少人觉得很突然,甚至觉得做大芯片好像很“容易”。我们一直没有对外讲过,大家不了解,我们默默干了四年多,花了135亿,等到O1量产后才披露,其实这
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩