### 2026-03-31 02:57 | #国产适配 #算力租赁 #GPU大盘

> 【GPU商业化周报 - 03.23-03.29】
> 
> 【GPU大盘】
> 
> 1、上周增量1.5k卡，来自「昆仑芯」回购336 卡 昆仑芯、「博世」320 卡 海光、「比亚迪」156 卡 L20/T4，以及「快网」「智衍」「作业帮」等。
> 2、昆仑芯上量加速：通过HAI减少客户适配国产卡和模型部署门槛，上周新增「地平线」160卡、「泡泡玛特」24卡、「牧原」16卡。
> 3、YTD收入9.7亿元，较上周+7043万元，毛利率35%。
> 4、本周预估本周0.9k卡上量，包括「酷音程」512卡5880、「唯品会」384卡5880。
> 
> 【产品专项】
> 
> 一、外租卡:「新华三」首批机型预计5月底交付
> 
> 1、物理机租赁:「新华三」首批512卡机型引进推进，预计周期1个月。暂定5.25日机器交付广州机房，「唯品会」和「TME」预计购买。华三新增供应512卡，本周引入供应链评估价格和交付模式。
> 
> 2、公有云租赁:新增「甘肃移动」1600卡4090，成本与自采接近，商务流程对接中。「北京电信」180卡4090已纳管，通过HAI可信集群屏蔽底层资源售卖，「灵初」具身数据处理模型POC中。
> 
> 3、算力租赁:
> -「山东魏桥」(2048卡H20-141G):总量2k卡分两个OEM厂商供货，含CDZ成本34450元/台/月(仅支持六年闭口)，交期3.5个月，整体价格偏贵，i平已现场考察，机房不合要求。期货风险高，计划转自研继续评估。
> -「郑州海光超算」(海光BW1000):本周初步对接，预计资源6.15日可批量提供。配合评估智源客户需求和上量节奏，进行资源引入。
> - 新次NVIDIA卡:5880累计预扣近千卡，持续推进购买
> 
> 二、新代次NVIDIA卡：5880累计预扣近千卡，持续推进购买
> 
> 1、5880ada:「小红书」「唯品会」、「中科闻歌」正式购420卡，同时「酷音程」「唯品会」等客户预扣近千卡，本周将履约购买。vRDMA机型已完成产品化支持售卖。
> 
> 2、5090Dv2:产品化机器本周正式交付，启动正式产品化，预计4月中旬支持客户POC，4月下旬正式售卖。
> 
> 3、PRO 5000-48G/72G:产品化机器预计4月上/中旬到货，预计4月中旬支持POC，5月支持正式售卖。
> 
> 三、国产卡:国产卡已累计售卖1288卡，其中海光672卡，昆仑芯616卡
> 
> 1、售卖进展:
> -海光BW1000_H:「博世」新增购买320卡，累计上量672卡;
> -昆仑芯P800:通过HAI累计售卖216卡:「地平线」160卡、「泡泡玛特」24卡、「牧原」16卡、「收钱吧」16卡;昆仑芯累计回购400卡。
> 
> 2、大模型卡:BW1101预计4月中旬到货，4月底可提供POC测试。
> 
> 3、小模型卡:海光 BW151(玄灵)、昆仑芯 P600测试机到货，已启动产品化，预计4月底支持客户POC。
> 
> 四、海外进展:主流可用区补货推进中
> 
> 1、大模型卡:新增韩国30卡H20用于提供TCI专项水位建设;其他区域H20补货跟进中，覆盖法兰克福(千卡级)、新加坡、马来西亚柔佛、印尼雅加达等节点。
> 
> 2、小模型卡:沙特L20、泰国H20供货，因供应商无主体资质，存在供应风险，已上升供应链，尝试寻找途径解决。

**点评**: 国产卡适配加速且昆仑芯上量明显，NVIDIA 5880 需求强劲，5090 机型交付在即，整体经营稳健。

---
### 2026-04-01 03:46 | #国产化适配 #GPU算子迁移

> 各位好， 通过上次的 cuda 优化， 最近在国产化 GPU skill又有一些探索 ：
> 
> 通过把海光的文档说明书 pdf ，快速转成国产海光 DCU 的算子迁移和优化 SKILL，  系统化完成 CUDA 算子到海光 DCU 的迁移、精度对齐与性能调优，可以达到海光的人工优化性能，在自动驾驶、一脉阳光的客户上也都得到验证提升。
> 
> :point_right: 详细介绍戳:  <https://km.woa.com/articles/show/656332?ts=1775012810>
> 
> 欢迎大家试用和共建 skill ： <https://git.woa.com/HyperAI/kernel-skills>
> 
> 帮忙一键三连一下[呲牙]

来源: dondon

**点评**: 通过文档自动化转化为国产GPU迁移优化能力，实现CUDA快速适配海光DCU并达到人工性能水准。

---
