# GPU — 2026-W23

---

## 6月新增Pro5000推理机型分货（8.2K卡）

**供应量级**：新增分货 8.2K 卡 Pro5000，其中 4.2K 卡为 5880 无法供应置换为 Pro5000。

**分货明细**：
- 战略：3232卡
- 出行：1904卡
- 北区：544卡
- 泛互：512卡
- 制造与能源：512卡
- 东区：512卡
- 金融：320卡
- 教育：224卡
- 其他：440卡

**重点客户**：小红书、滴滴、拼多多、长安、元戎、机科未来

**需求情况**：6月总需求 2.3万卡，行业分布为战略(31%)、出行(28%)、区域、制造与能源、教育、泛互、金融等。

**分货逻辑**：
- 产品毛利率 >= 30% → 需求满足率约 75%
- 产品毛利率 >= 15% → 需求满足率约 50%
- 产品毛利率 < 15% → 需求满足率约 25%
- 若暂无报价但需求明确 → 需求满足率 10%

(From dandan)

---

## 昆仑芯6月供应情况

6月我们到底能拿到多少昆仑芯？为什么一线还是不知道我们有什么国产卡，什么时候能到？

昨天晚上收到通知6月份会有1048卡昆仑芯，我们正在匹配用户需求，今天给出分货意见。目前获得的资源是严重不足需求的，大概每个月需要5000卡昆仑芯左右，5月份分了900卡。

我们目前外部寻源租不同的卡型大概有6000+。老板提到的海光郑州已经租了2000，还在进一步联系行业做适配，这部分卡有个问题是cpu和内存的配比都很低，导致很多场景效率提不上去。

现在我们也在各个行业去跑，从技术上和业务连续性上说服客户去使用小卡和国产卡，会发现一些新的机会。另外也在国内外寻找租卡的机会。最近也刚匹配了少量沐曦的需求。但是整体缺口还是非常大，每个月稳定需求有4000国产卡和10000推理n卡。

(From 阿碧)

---

## 国产卡POC每日进展（2026/06/05）

**经营系统面板**：https://gpubiz.woa.com/poc-daily

**新增售卖**：
- 「南山政数局」新增购买160卡全国产海光BW1000
- 「idea」新增购买256卡BW1000，累计512卡
- 「小红书」累计下单达到1080卡P800

**主要进展**：
1.【长安】
   - 昆仑芯：P800上跑通5个自研模型，多机测试与精度对齐中；排查16机网络带宽问题，适配世界模型并完成单机测试
   - 海光：5个模型大部分测试完成，端到端二阶段模型客户有调整，2机性能测试中；VLA/世界模型/MoE模型优化中

2.【无垠科技】：sglang框架，性能当前A800持平，VL+LLM模块单卡性能达A800的80%，多卡性能继续优化中，客户需求6月中旬前上量

3.【小红书】：Qwen3.5-397B和Kimi2.5性能客户认可；新需求模型GLM5.1、Kimi2.6数据已跑出，DS-V4 pro在跑数据；持续上量中

4.【灵初智能】：海光BW1000四机、八机训练任务已完成符合预期，客户预计月中购买；外租注册节点ti-one纳管已提需求，数据需传输郑州超算

**主要TODO**：
- 【小红书】模型测试与新模型测试 → @alexsang
- 【无垠科技】模型性能优化 → @kehuanfeng
- 【酷睿程】训练和推理模型测试 → @xuejiangong
- 【灵初智能】海光多机训练测试 → @kehuanfeng

(From 阿强)
