# GPU — 2026-W24

---

## 市场及友商情况

基于市场趋势、行业需求和友商损益分析，GPU需求仍持续增长，预估未来两年，年均需求超20万卡。

## 资源和地域规划

1、**卡型策略**：国内多芯体系持续迭代，大卡国产为主，小卡英伟达为主，海外寻求高算力补充。27-28年每年新增24万卡，构成为：国内大卡9.6万 + 国内小卡9.6万 + 海外小卡0.8万 + 海外大卡(单列)4万。

2、**地域部署**：考虑客户需求和成本差异，往低价园区引导。国内以环沪/环京为主，同时提升中卫/乌兰察布部署比例；海外重点部署马来、德国和美国。

## 未来三年损益分析

### 不含单列高性能卡
未来三年规划68.6万卡，收入复合增长87%：
- 26年新增28.6万卡
- 27年新增20万卡，收入142亿
- 28年新增20万卡，收入193亿

### 含单列高性能卡（对齐预算）
未来三年规划85.7万卡，收入复合增长147%：
- 26年新增37.7万卡
- 27年新增24万卡，收入268亿
- 28年新增24万卡，收入444亿

(From 阿碧)

---

## 6月昆仑芯P800 + 7月新华三H20分货

**一、6月新增1000卡昆仑芯P800**

匹配计划：战略416卡，出行216卡，北区128卡，泛互120卡，制造与能源48卡，其他(含备机)72卡；重点支持小红书、地平线、昆仑芯、无垠等客户上量；

需求及分货逻辑如下：
- 【需求情况】6月需求6576卡，主要来自战略（占比43%）、出行、区域、泛互等行业；
- 【分货量级】6月可分货1000卡；
- 【分货逻辑】结合客户每月必保量级，优先满足产品毛利率>=15%的客户需求；
  - 产品毛利率>=30%客户，需求满足率100%
  - 产品毛利率>=20%，满足率50%
  - 产品毛利率>=15%，满足率20%

数据面板：https://gpudata.woa.com/gpu-alloc/#big-card-alloc/bc-tab-2

另外，老板，本次美团和元宝的合作项目，急需6月15日上量736卡昆仑芯，经运管与自研协调，可借出736卡满足美团需求，但需要云从7月和8月昆仑芯的分货份额中归还。

**二、7月预估交付的外租新华三1024卡H20**

交付方式是以租代采放到云的广州五区IDC。

匹配计划如下：唯品会512卡（战略，4年包销，3.6万/台），影石256卡（制造与能源，4年包销，3.9万/台），微众240卡（金融，4年包销，3.8万/台），备机16卡；

需求及分货逻辑如下：
- 【需求情况】需求2400卡，主要来自战略(占比51%)、金融、制造与能源等行业；
- 【分货量级】7月交付1024卡外租H20；
- 【分货逻辑】首批512卡H20是联合唯品会背靠背邮件申请锁卡，因此512卡计划优先满足唯品会。剩余496卡则满足商务条件优的客户；若分货后客户1周内没购买，则分配给其他客户；

数据面板：https://gpudata.woa.com/gpu-alloc/#big-card-alloc/bc-tab-3

(From dandan)

---

## 政数局海光机器进展（2026-06-10）

**当前进展**：HCCPD1h 到货20台，客户晚上7点已买走19台，剩下一台机器作为备机

**故障根因定位**：DCU驱动与IB驱动的加载顺序不固定偶发引起故障，已通过临时方案规避给客户使用。长期方案厂商继续排查分析提供。

(From chris)

---

## GPU上周销售数据（2026-06-10）

- GPU上周售3.7k卡，收入8383万
- 5880/5090Dv2为主力，「小红书」「长城」等客户毛利超40%
- 6月预计 8.2k 卡 PRO 5000 到货，今日已分货，全量售出后，将带动周收增长400w元
- 外租累计引入5.2k卡，已售2k卡，POC中2k卡

**风险**：6月仍需 4k+昆仑芯保供「小红书」「拼多多」「地平线」「大疆」等客户，稳固商机。

(From 黄阳)

---

## 北京AI峰会 Loopit + 海光信息（2026-06-10）

本周北京AI峰会，Loopit、百川、海光等客户和供应商会参与交流。

**【Loopit（客户）】**
- 背景：专注线上娱乐的AI创业公司，核心诉求围绕海外多模态世界模型训练算力合作。多模态世界模型训练（视频路线，类似Cosmos/Genie 3），目标SOTA，用于"头号玩家"式元宇宙虚拟娱乐。
- 核心诉求：
  1. 优先B卡（B200/B300），次选H卡（H100/H200），拒绝A卡
  2. 位置倾向北美本地，次选东南亚（需合规评估）
  3. 短期千张H级别起，长期可扩展至万卡；需同一集群保障（8000卡上限），支持弹性扩展
  4. 国内只有推理需求，量级少，主要用Tokenhub API满足
- 产品应对：海外与NCP共建GPU集群（合同与腾讯签）；国内引导采用腾讯云国产卡方案

**【海光（供应商）】**
- 进展：海光的CUDA兼容在训练场景客户适配较快，云在自动驾驶、具身智能训练场景落地博世（出行）、一汽（出行）、IDEA（南区）、一脉阳光（医疗）等客户，总计上量2800+卡BW1000（64G版本）。灵初（南区）、智源（教育）等千卡重点推进中，预计6-7月陆续落单。
- 问题：BW1101（144G版本）原计划4月支持POC，5月批量交付，目前仍不具备POC条件，整体节奏延期。预计云产品6月～8月海光大卡存在供应断档风险，可能导致客户流失，包括比亚迪、拼多多、地平线等。
- 原因：BW1101机型存在GPU开机掉卡风险（筛选后0.1%，量产标准为0.01%），海光预计6月中下完成改版，7月份恢复整机供应，但未承诺解决时间。
- 求助：期望海光尽快解决，并明确解决时间。

(From 黄阳)

---

## 艾特云翔H800资源协调（2026-06-10）

我们在外租寻源的艾特云翔在湖南的32台H800，昨晚被SD分给了混元测试。一兆和sam找了dowson老板协调，今早外租的这200卡已经还回CSIG继续跟进了。

我们昨天跟行业商量，因为是区域自己引荐的卡，由区域自行去上升比较妥当，所以让他们先去争取了。

(From dandan)

---

## 沐曦C500采购计划（2026-06-10）

为承接外部客户业务需求，异构团队计划引入沐曦 C500 机型满足行业国产卡需求。本次首批设备计划采购 1040 卡，支撑智慧行业一部量衍未来、北京硅基流动两大客户包销购买，行业已进行邮件需求审批。

**背景**：主要场景是用作L20的替代的国产小模型卡，面向自动驾驶数据清洗、小模型推理等场景。沐曦C500是客户前期已经适配和优化过的机型，已耗时1个季度完成适配。

**机型配置**：星河V1- AMD Genoa 9K84_96C_400W*2/DDR5 64G 5600*24/M.2 SATA 480G*1/C500*8/银杉1.0*1

**预估需求**：首批计划下单130台/1040卡

**影响评估**：
- 技术可行性：已充分评测沐曦C500，且客户前期已完成适配，技术风险可控
- 收益评估：LLM推理场景下，C500的平均性能是L20的1.50倍；开源DIT模型下，C500平均性能是L20的1.73倍；传统推理场景下C500平均性能是L20的1.25倍
- 供应评估：GPU暂无卡点，整体供应链标准LT约27周；CPU/内存/SSD供应良好；网卡银杉1.0 EOL，通过业务间腾挪满足

(From 邮件)

---

## 4090客户需求情况（2026-06-10）

4090一共外租了2340卡，已售卖1600卡，剩余预计客户POC完后会买走。4090我们主要是寻找一些便宜的资源，主要是为了接住小模型推理且有高性价比需求的客户。

**已上量**：
- 慧橙，1600卡，Qwen3.6-27B推理

**POC中**：
- 科迈，400卡
- 泽云，160卡

对外部客户售价在包月8~9千（含税），毛利率是15%左右。现在小客户购买以包月为主，弹性使用，不过这批货的租期是1年的，我们按年续租，所以包月售卖的风险也不大。

目前外租的4090卡基本已经全部订完了，需要控制下需求往5090D V2引导。

(From coby)

---

## 北区拜访进展（2026-06-10）

感谢产研兄弟姐妹的大力支持，这次丹姐带队拜访给客户和团队都增强了很大的信心：

**一、pro5000：【面壁】和【稳准】**
- 进展：均与客户达成商务条款，静等产品团队分卡

**二、P800：【无垠】**
- 进展：感谢丹姐、东神及研发团队的大力支持，这两天的测试有了比较大的进展，目前测试结果与A800效果打平
- 下一步：
  1. SGlang框架下继续验证精度，确保精度满足要求以及解决lightLLM框架下tp=1 oom的问题
  2. 静等产品团队分卡：6月10日客户要开通第一批机器（16~18台，取决于与A800的综合性能对比），2个月后扩到30台
  3. 等下周分配到pro5000测试机后开始测试

**三、5090D：【生数】**
- 进展：今天东神团队与客户VP交流了基于 RDMA 的模型启动加速方案，双方对技术适配性、现有性能瓶颈及后续合作模式进行了深入探讨，效果很好
- 下一步：客户评估二次开发的工作量及适配可行性；5090D的到货周期和价格谈判

**四、B200/B300、pro6000海外卡需求：【loopit】+【爱诗】+【面壁】+【Minimax】+【星河】+【稳准】**
- 进展：填写了CRP预测单
- 下一步：系统开放leader能查看团队成员提单信息的权限；目前系统中没有B300型号，B300的算力需求揉到了B200中，待系统中有B300型号后进行调整

(From 北区)

---

## 国产卡POC进展（2026-06-05）

经营系统：https://gpubiz.woa.com/poc-daily

**新增售卖**：
- 「南山政数局」新增购买160卡全国产海光BW1000
- 「idea」新增购买256卡BW1000，累计512卡
- 「小红书」累计下单达到1080卡P800

**主要进展**：
1. 【长安】：昆仑芯已在P800上跑通5个自研模型，正在进行多机测试与精度对齐；同时排查16机网络带宽问题；海光5个模型大部分测试完成，端到端二阶段模型客户有调整
2. 【无垠科技】：sglang框架，性能当前A800持平，客户当前认可当前性能；vl+llm模块还在优化中，单卡性能可达A800的80%，多卡性能需继续优化，客户需求在六月中旬前上量
3. 【小红书】：Qwen3.5-397B和kimi2.5性能客户认可；新需求模型GLM5.1、kimi2.6数据已经跑出，DS-V4 pro在跑数据；持续上量中
4. 【灵初智能】：海光BW1000四机、八机训练任务已完成，符合预期；客户预计月中购买

**主要TODO**：
1. 【小红书】：模型测试与新模型测试 @alexsang
2. 【无垠科技】：模型性能优化 @kehuanfeng
3. 【酷睿程】：训练和推理模型测试 @xuejiangong
4. 【灵初智能】：海光多机训练测试 @kehuanfeng

---

## 昆仑芯资源缺口问题（2026-06-10）

6月我们到底能拿到多少昆仑芯？为什么一线还是不知道我们有什么国产卡，什么时候能到？

昨天晚上收到通知6月份会有1048卡昆仑芯，我们正在匹配用户需求，今天给出分货意见。目前获得的资源是严重不足需求的，大概每个月需要5000卡昆仑芯左右，5月份分了900卡。

我们目前外部寻源租不同的卡型大概有6000+。老板提到的海光郑州已经租了2000，还在进一步联系行业做适配，这部分卡有个问题是cpu和内存的配比都很低，导致很多场景效率提不上去。

我们也在各个行业去跑，从技术上和业务连续性上说服客户去使用小卡和国产卡，会发现一些新的机会。另外也在国内外寻找租卡的机会。最近也刚匹配了少量沐曦的需求。但是整体缺口还是非常大，每个月稳定需求有4000国产卡和10000推理n卡。