曝DeepSeek跳出英伟达限制绕过CUDA 为适配中国国产GPU做准备
DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。
据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。

众所周知,英伟达的CUDA(Compute Unified Device Architecture,统一运算架构)能大幅降低研发大模型的难度,获全球开发商使用,一举将英伟达推上AI芯片领域的垄断地位。
但最新发现显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX(Parallel Thread Execution)语言,而非高级编程语言CUDA。
这样意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。
对于程序开发人员来说,CUDA是一种更加友好的高级语言,开发者只需要专注于程序和算法最相关的运行逻辑,而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的,从而能够降低开发难度。
而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。
换句话说,DeepSeek把优化做到了极致。
北京航空航天大学副教授黄雷表示,绕过CUDA可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。
这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
“这凸显了DeepSeek非凡的工程水平,并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。
-
阿里千问回应APP“崩了”:我好着呢 状态良好 欢迎来问
今天早间,“阿里巴巴千问崩了”相关话题一度冲上微博热搜。随后,千问官微发文回应称:“我好着呢,状态良好,欢迎来问。”今日,阿里巴巴新推出的AI应用“千问”迎来公测,结果首日即遭流量洪峰:用户涌入过载,
-
OpenNof1 – 开源的AI自主交易系统,实时交易监控
OpenNof1是什么OpenNof1 是 AI 自主交易系统,支持为用户提供自动化交易决策和风险管理。OpenNof1支持多种 AI 提供商(如 OpenAI、DeepSeek 等),能通过实时市场
-
半年不到 DeepSeek已跌落神坛
属实没想到,半年前还风靡全球的 DeepSeek 就这么跌下神坛了。据 QuestMobile 推出的《2025年二季度AI应用价值榜》数据显示,其月均下载量暴跌 72.2%,从惊人的八千多万下载量跌
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
关注网络尖刀微信公众号随时掌握互联网精彩
- 天舟八号货运飞船已受控再入大气层
- 刘大锤曝黄圣依不离婚真正原因:有钱有闲伪单身生活
- 捡漏配送端 v1.7最新版本2022下载地址
- 图图闹钟 1.0.0.2最新版本2022下载地址
- 跟前妻见一次睡一次总裁
- 聚电桩app v3.5.0最新版本2022下载地址
- 轻松换背景 2.1.0.1最新版本2022下载地址
- 99科技app v1.0.0最新版本2022下载地址
- Ulead Photo Express(我形我速) 4.0.0.0最新版本2022下载地址
- 越光宝盒 2.2.0.1最新版本2022下载地址
- 美萍客户管理系统 6.1最新版本2022下载地址
- 智慧宿舍ios版 v2.0.9.1最新版本2022下载地址

恶犬
