vault add gpu  
  
  
  
政数局海光机器进展同步：   
  
  
  
当前进展：HCCPD1h 到货20台机器，客户晚上7点已买走19台，剩下一台机器作为备机  
  
  
  
故障根因定位：DCU驱动与IB驱动的加载顺序不固定偶发引起故障，已通过临时方案规避给客户使用   
  
长期方案厂商继续排查分析提供  
  
(From chris)  
  
  
  
vault add gpu  
  
  
  
GPU上周售3.7k卡，收入8383万。5880/5090Dv2为主力，「小红书」「长城」等客户毛利超40%。6月预计 8.2k 卡 PRO 5000 到货，今日已分货，全量售出后，将带动周收增长400w元。外租累计引入5.2k卡，已售2k卡，POC中2k卡。  
  
  
  
风险：6月仍需 4k+昆仑芯保供「小红书」「拼多多」「地平线」「大疆」等客户，稳固商机。  
  
(From黄阳)  
  
  
vault add gpu  
  
  
  
另外本周的北京AI峰会，听北区团队反馈Dowson也会去拜访几个当地客户和供应商。包括Loopit、百川、海光等。  
  
  
  
其中Loopit和海光交流的议题可能跟GPU相关，我们也梳理了一些信息，供两位老板参考：  
  
  
  
【Loopit（客户）】  
  
客户背景：  
  
专注线上娱乐的AI创业公司，核心诉求围绕海外多模态世界模型训练算力合作。多模态世界模型训练（视频路线，类似Cosmos/Genie 3），目标SOTA，用于“头号玩家”式元宇宙虚拟娱乐。   
  
  
  
核心诉求：  
  
1、优先B卡（B200/B300，面向未来、适配SOTA），次选H卡（H100/H200，无奈选择），拒绝A卡（算子要求高、无法迭代）。    
  
2、位置倾向北美本地，避免数据倒腾效率低、停机等问题。次选考虑东南亚，性价比高但需合规评估。    
  
3、短期千张H级别起，长期可扩展至万卡；需同一集群保障（8000卡上限），支持弹性扩展。    
  
4、国内只有推理需求，但需求量级少，主要用Tokenhub API满足。  
  
  
  
产品应对：  
  
1、海外：与NCP共建GPU集群，合同与腾讯签，客户关注交付速度、稳定性、性价比、长期合作。— 本周已求助供应链，暂无新增供应机会  
  
2、国内：引导采用腾讯云国产卡方案。待客户业务推广，推理业务上量后启动。  
  
  
  
【海光（供应商）】  
  
进展：  
  
海光的CUDA兼容在训练场景客户适配较快，云在自动驾驶、具身智能训练场景落地博世（出行）、一汽（出行）、IDEA（南区）、一脉阳光（医疗）等客户，总计上量2800+卡BW1000（64G版本）。灵初（南区）、智源（教育）等千卡重点推进中，预计6-7月陆续落单。  
  
  
  
问题：  
  
BW1101（144G版本）原计划4月支持POC，5月批量交付。目前仍不具备POC条件，整体节奏预期。预计云产品6月～8月海光大卡存在供应断档风险，可能导致客户流失，包括比亚迪、拼多多、地平线等。  
  
  
  
原因：  
  
BW1101机型存在GPU开机掉卡风险（筛选后0.1%，量产标准为0.01%），海光预计6月中下完成改版，7 月份恢复整机供应，但未承诺解决时间。  
  
  
  
求助：  
  
期望海光尽快解决，并明确解决时间。  
  
(From黄阳)  
  
  
vault add gpu  
  
  
  
我们在外租那里寻源的 艾特云翔在湖南的32台H800，昨晚被SD分给了混元测试，一兆和sam找了dowson 老板协调  
  
  
  
dowson老板今早应该是去找SD协调了，今早外租的这200卡已经还回CSIG继续跟进了  
  
  
  
我们昨天跟行业商量，因为是区域自己引荐的卡，由区域自行去上升比较妥当，所以让他们先去争取了  
  
  
  
(From dandan)  
  
  
vault add openclaw  
  
**一、今日小结**  
  
**经营数据**  
  
整体 OpenClaw 现网规模约 77.2 万核，用户数约 18.9 万，净增总规模约 0.9 万核，总订单收入约 4,481 万元  
  
**重点进展**  
  
Lighthouse：Hermes 镜像升级至 v0.15.0 并全量发布；国际站 Hermes 面板新增 Telegram/WhatsApp/Discord 通道前端配置（灰度中）  
  
企业版 ClawPro：新增 DeepSeekTUI、OpenCode 预设 Agent 类型和镜像；镜像管理支持查看更新记录和推送更新通知；agent 列表支持按标签查询；模型连通性检测上线；对接 SkillHub 角色技能包；实例配额占用和释放情况 API 发布  
  
OpenClaw 云端全托管：CloudAgent + Wisp 支持单机部署模式；移动端微信公众号 OAuth 登录上线，与扫码共用 unionid 账号体系；service-gateway 接入微信 OAuth 域名验证；昵称/头像内容审核改为同步处理；Soul 注入状态标签统一展示；修复中国大陆 Google Fonts 渲染阻塞  
  
应用产品：AgentChat 6 月冲刺目标更新，Agent 群聊暂定 6.2 提测，云端 Browser Use 已可体验，单次 Token 统计 OpenClaw 已上线；LightVela 消息通道安全问题已解决待放口  
  
SkillHub 场景化生态：作者推荐 API 上线，支持同类目/同标签/共同关注多源召回与多层 Redis 缓存；Skills 商家付费沙箱生命周期处理器（EnsureReady/Resume/SetConfigOption）上线；SkillHub 平台翻译 skipped 终态上线；开源社区 masonxhuang 合并 PR 阻止不受信任工作空间通道加载，参与修复 browser 稳定 tab 引用，yuehuali 参与排查 QQBot WebSocket 重连问题  
  
**规划中**  
  
国际站 Hermes 面板 Telegram/WhatsApp/Discord 通道灰度后全量发布  
  
AgentChat Agent 群聊 6.2 提测，云端 Browser Use 继续推进上线；Hermes 镜像流式输出本周发布  
  
OpenClaw 云端全托管内测产品体验优化，LightVela 消息通道待放口  
  
ClawPro 企业版 CIAM 接入与企业客户网络互通（VPC/CCN 专线）重点需求推进  
  
SkillHub 场景化专区 Skill 包研发；Skills 商家付费沙箱功能持续完善  
  
(From pablo)  
  
vault add gpu  
  
为承接外部客户业务需求，异构团队计划引入沐曦 C500 机型满足行业国产卡需求。本次首批设备计划采购 1040 卡，支撑智慧行业一部量衍未来、北京硅基流动两大客户包销购买，行业已进行邮件需求审批。  
  
**1、**  
  
**背景**  
  
主要场景：用作L20的替代的国产小模型卡，面向自动驾驶数据清晰、小模型推理等场景。  
  
选用C500原因：  
  
1）沐曦C500是客户前期已经适配和优化过的机型，已耗时1个季度完成适配。如其他的国产卡需重新进行适配流程，人力和时间都不可控，所以客户提出C500需求；  
  
2）行业已完成邮件GM审批，并且承诺500卡的包销以及500卡扩容的商机；  
  
**2、机型配置**  
  
星河V1- AMD Genoa 9K84_96C_400W*2/DDR5 64G 5600*24/M.2 SATA 480G*1/C500*8/银杉1.0*1  
  
星河V1+银杉1.0的配置为成本最优  
  
**3、预估需求**  
  
首批计划下单130台/1040卡，主要用于满足内部以及外部用户（量衍未来，北京硅基流动科技有限公司）需求。  
  
**4、影响评估**  
  
• 技术可行性：已充分评测沐曦C500，且客户前期已完成适配，技术风险可控。  
  
• 收益评估：LLM推理场景下，C500的平均性能是L20的1.50倍；开源DIT模型下，C500平均性能是L20的1.73倍；传统推理场景下C500平均性能是L20的1.25倍。  
  
取以上三个场景的平均值，得到以下C500与其他推理卡性价比对比如下：  
  
  
  
• 供应评估：  
  
GPU暂无卡点，受限于各物料，整体供应链标准LT约27周。  
  
CPU：AMD Genoa 9K84_96C_400W共260pcs，可支撑该需求使用；  
  
内存：DDR5 64G 总量比较紧张，支撑1040卡需求没有问题；  
  
SSD：M.2 SSD 480G*1 LT 13周，供应良好；  
  
网卡：银杉1.0网卡 EOL，通过业务间腾挪满足。后续迭代采用天河V2+玄灵200G机型；  
  
GPU：沐曦C500 供应良好。  
  
(From邮件)  
  
vault add gpu  
  
  
  
4090 目前主要哪些客户有需求？  
  
  
  
4090一共外租了2340卡，已售卖1600卡，剩余预计客户POC完后会买走。4090我们主要是寻找一些便宜的资源，主要是为了接住小模型推理且有高性价比需求的客户。  
  
  
  
这类客户原本用的是4090、5090消费卡居多，对于卡型不挑，但对价格敏感。  
  
  
  
已上量：  
  
慧橙，1600卡，Qwen3.6-27B推理  
  
  
  
POC：  
  
科迈，400卡  
  
泽云，160卡  
  
  
  
大都是区域和渠道的中小客户  
  
  
  
目前外租的4090卡基本已经全部订完了，需要控制下需求往5090D V2引导  
  
  
  
对外部客户售价在包月8~9千（含税），毛利率是15%左右。  
  
  
  
现在小客户购买以包月为主，弹性使用，不过这批货的租期是1年的，我们按年续租，所以包月售卖的风险也不大  
  
  
  
(From coby问询)  
  
  
vault add gpu
为承接外部客户业务需求，异构团队计划引入沐曦 C500 机型满足行业国产卡需求。本次首批设备计划采购 1040 卡，支撑智慧行业一部量衍未来、北京硅基流动两大客户包销购买，行业已进行邮件需求审批。  
  
**1、**  
  
**背景**  
  
主要场景：用作L20的替代的国产小模型卡，面向自动驾驶数据清晰、小模型推理等场景。  
  
选用C500原因：  
  
1）沐曦C500是客户前期已经适配和优化过的机型，已耗时1个季度完成适配。如其他的国产卡需重新进行适配流程，人力和时间都不可控，所以客户提出C500需求；  
  
2）行业已完成邮件GM审批，并且承诺500卡的包销以及500卡扩容的商机；  
  
**2、机型配置**  
  
星河V1- AMD Genoa 9K84_96C_400W*2/DDR5 64G 5600*24/M.2 SATA 480G*1/C500*8/银杉1.0*1  
  
星河V1+银杉1.0的配置为成本最优  
  
**3、预估需求**  
  
首批计划下单130台/1040卡，主要用于满足内部以及外部用户（量衍未来，北京硅基流动科技有限公司）需求。  
  
**4、影响评估**  
  
• 技术可行性：已充分评测沐曦C500，且客户前期已完成适配，技术风险可控。  
  
• 收益评估：LLM推理场景下，C500的平均性能是L20的1.50倍；开源DIT模型下，C500平均性能是L20的1.73倍；传统推理场景下C500平均性能是L20的1.25倍。  
  
取以上三个场景的平均值，得到以下C500与其他推理卡性价比对比如下：  
  
  
  
• 供应评估：  
  
GPU暂无卡点，受限于各物料，整体供应链标准LT约27周。  
  
CPU：AMD Genoa 9K84_96C_400W共260pcs，可支撑该需求使用；  
  
内存：DDR5 64G 总量比较紧张，支撑1040卡需求没有问题；  
  
SSD：M.2 SSD 480G*1 LT 13周，供应良好；  
  
网卡：银杉1.0网卡 EOL，通过业务间腾挪满足。后续迭代采用天河V2+玄灵200G机型；  
  
GPU：沐曦C500 供应良好。  
  
(From邮件)  
  
vault add gpu  
  
  
  
感谢产研的兄弟姐妹的大力支持，这次丹姐带队拜访给客户和团队都增强了很大的信心，项目推进速度非常快，我给各位领导汇报下这两天的项目进展和下一步计划：  
  
  
  
一、pro5000：【面壁】和【稳准】  
  
进展：均与客户达成商务条款，静等产品团队分卡。  
  
  
  
二、P800：【无垠】 ：  
  
进展：感谢丹姐、东神及研发团队的大力支持，这两天的测试有了比较大的进展，目前测试结果与A800效果打平。  
  
下一步：1）SGlang框架下继续验证精度，确保精度满足要求以及解决lightLLM框架下tp=1 oom的问题；  
  
2）静等产品团队分卡： 6月10日客户要开通第一批机器（16~18台，取决与A800的综合性能对比），2个月后扩到30台。  
  
3）等下周分配到pro5000测试机后开始测试。  
  
  
  
三、5090D：【生数】  
  
进展：今天东神团队与客户VP交流了基于 RDMA 的模型启动加速方案，双方对技术适配性、现有性能瓶颈及后续合作模式进行了深入探讨，效果很好。  
  
下一步：1）客户评估二次开发的工作量及适配可行性 2）5090D的到货周期和价格谈判  
  
  
  
四、B200/B300、pro6000海外卡的需求：【loopit】+【爱诗】+【面壁】+【Minimax】+【星河】+【稳准】  
  
进展：填写了CRP预测单  
  
下一步：1）系统开放leader能查看团队成员提单信息的权限，已拉群在解决。  
  
2）目前系统中没有B300型号，B300的算力需求揉到了B200中，待系统中有B300型号后进行调整。  
  
(From 北区)  
  
  
vault add business  
  
  
  
TOP7客户一周概述：  
  
拼多多  
  
本周购买退还  
  
购买：521109c  
  
退还：89932c  
  
一周大事件：  
  
1、ITA9a+pqos机型：本周客户验证pqos功能内存带宽统计存在不准确的问题，经虚拟化同学排查原因为客户内核业务初始化脚本里有一段 fallback 逻辑错误，已反馈客户优化修正，本周日持续验证和观察，没问题下周开启pqos机型购买，预计下周购买规模到100wc；  
  
2、GPU测试：Pro5000 48G/72G机型客户测试中，海光BW151测试中，昆仑芯P800测试中，测试中关于测试用例、方案文档等内容已单独反馈需求和支持客户；  
  
3、CVM新机型测试：SA9 vRDMA测试机已交付客户，待客户验证测试；DA9预计6月上旬给客户POC测试机，6月完成产品化；  
  
  
  
小红书  
  
购买：336237C  
  
退还：87450C  
  
一周大事件：  
  
1. Genoa库存机器售卖方案: 为满足世界杯资源需要，预计供应65万核特殊规格SA4.48XLARGE768-r，本周已预扣22万核（已完成SP包匹配、XHS所需特性支持），还需TKE适配，客户预计下周开始购买；有40万+供应主要依赖于ITA4a（库存+采购在途）改造，预计6月底改造完成，已求助运管提拉。  
  
2.GPU相关：PRO 5000测试：PRO5000 E2E QPS 慢 12% ，本周研发与客户联合定位：已经排除虚拟化开销（<1%）、 DMA（两侧一致） 、H2D 本身耗时（最多 0.5%）因素，判断差距在H2D准备时间，根因待进一步定位。  
  
  
  
快手  
  
本周购买退还  
  
购买：825c  
  
退还：4023c  
  
一周大事件：  
  
本周无更新；  
  
  
  
滴滴  
  
本周购买退还  
  
购买：281c  
  
退还：263c  
  
一周大事件：  
  
本周无更新；  
  
  
  
美团  
  
本周购买退还  
  
购买：26000c  
  
退还：26096c  
  
一周大事件：  
  
 2. 国内GPU需求：5090Dv2 GPU机型测试完成，技术面暂无卡点，还在等待客户内部进一步决策；  
  
  
  
京东  
  
本周购买退还  
  
购买：736c  
  
退还：736c  
  
一周大事件：  
  
本周无更新；  
  
  
  
字节  
  
本周购买退还  
  
购买：28586c  
  
退还：35586c  
  
一周大事件：  
  
3. 小规格机器需求：客户新增较大规格（4C/8C/16C等）需求约10万核，资源层面优先使用北京、上海SA4等闲置资源满足，预计下周开始上量；  
  
4. 22W核SA9-NPS4和SA4-NPS4需求后台完成13W核交付，下周初小规模购买进行流程验证，通过后即可批量购买。  
  
(From zhubing)  
  
  
vault add openclaw  
  
  
  
1️⃣产品命名：  
  
  
  
选项一，Agent Computer：给每个智能体的一台专属云上电脑。  
  
选项二，Agent Station：智能体在云上的驻留与执行站点。  
  
  
  
2️⃣产品定位：  
  
  
  
Agent Computer / Agent Station 是为长时 Agent 任务设计的云上受控执行环境，基于腾讯云 CVM 构建，适合运行比 Sandbox 更长时、更复杂、资源需求更高的 Agent 任务。  
  
  
  
3️⃣和 Agent Sandbox 的差异：  
  
  
  
- Agent Sandbox 适合短时、轻量、强隔离、高并发任务，例如代码片段执行、工具调用、网页抓取、临时自动化等  
  
- Agent Station/Computer 适合更长时间、更复杂环境、更强资源需求的 Agent 任务，例如完整代码仓库开发、长链路浏览器操作、复杂依赖安装、持续调试等  
  
  
  
当前进展：  
  
  
  
场景1：Skill评测  
  
当前已完成与Agent Station/Computer后端模块的集成，后端链路已经跑通，计划选取约 100 个 Skill 进行实际运行，并将测评结果对外产品化。  
  
Skill 评测主要用于离线场景，对实时性和资源可用性要求不高，后续安排在夜间等低峰时段执行，以降低对在线资源的影响。  
  
  
  
场景2：付费Skill预览  
  
针对付费Skill在云端沙箱中运行，并将运行效果预览呈现给C端Skill使用者的场景，目前正在开发调试，预期随付费Skill功能一起上线。  
  
  
  
场景3：云开发集成Agent Station/Computer  
  
联调与基本完成，但按照云开发目前产品形态，需Agent Station/Computer资源对用户可见，在腾讯云控制台需要能查看并管理，此前提是Agent Station/Computer正式对外产品化。短时内暂时没法对外提供服务，需进一步对齐后续计划。  
  
(From pablo)

vault add gpu  
  
一、6月新增1000卡昆仑芯P800  
  
匹配计划：战略416卡，出行216卡，北区128卡，泛互120卡，制造与能源48卡，其他(含备机)72卡；重点支持小红书、地平线、昆仑芯、无垠等客户上量；  
  
需求及分货逻辑如下：  
【需求情况】6月需求6576卡，主要来自战略（占比43%）、出行、区域、泛互等行业；  
【分货量级】6月可分货1000卡；  
【分货逻辑】结合客户每月必保量级，优先满足产品毛利率>=15％的客户需求；  
产品毛利率>=30%客户，需求满足率100%；产品毛利率>=20%，满足率50%；产品毛利率>=15%，满足率20%；  
  
https://gpudata.woa.com/gpu-alloc/#big-card-alloc/bc-tab-2  
  
另外，老板，本次美团和元宝的合作项目，急需6月15日上量736卡昆仑芯，经运管与自研协调，可借出736卡满足美团需求，但需要云从7月和8月昆仑芯的分货份额中归还；  
  
二、7月预估交付的外租新华三1024卡H20，交付方式是以租代采放到云的广州五区IDC。  
  
匹配计划如下：唯品会512卡（战略，4年包销，3.6万/台），影石256卡（制造与能源，4年包销，3.9万/台），微众240卡（金融，4年包销，3.8万/台），备机16卡；  
  
需求及分货逻辑如下：  
【需求情况】需求2400卡，主要来自战略(占比51%)、金融、制造与能源等行业；  
【分货量级】7月交付1024卡外租H20；  
【分货逻辑】首批512卡H20是联合唯品会背靠背邮件申请锁卡，因此512卡计划优先满足唯品会。剩余496卡则满足商务条件优的客户；若分货后客户1周内没购买，则分配给其他客户；  
  
https://gpudata.woa.com/gpu-alloc/#big-card-alloc/bc-tab-3  
  
(From dandan)

vault add gpu  
【市场及友商情况】  
基于市场趋势、行业需求和友商损益分析，GPU需求仍持续增长，预估未来两年，年均需求超20万卡。  
  
【资源和地域规划】  
1、卡型策略：国内多芯体系持续迭代，大卡国产为主，小卡英伟达为主，海外寻求高算力补充。27-28年每年新增24万卡，构成为：国内大卡9.6万 + 国内小卡9.6万 + 海外小卡0.8万 + 海外大卡(单列)4万。  
  
2、地域部署：考虑客户需求和成本差异，往低价园区引导。国内以环沪/环京为主，同时提升中卫/乌兰察布部署比例；海外重点部署马来、德国和美国。  
  
【未来三年损益分析】  
1、不含单列高性能卡：未来三年规划68.6万卡，收入复合增长87%：26年新增28.6万卡， 27年新增20万卡，收入142亿，28年新增20万卡，收入193亿。  
  
2、含单列高性能卡（对齐预算）：未来三年规划85.7万卡，收入复合增长147%：26年新增37.7万卡，27年新增24万卡，收入268亿，28年新增24万卡，收入444亿。  
(From 阿碧)

vault add gpu  
  
国产卡POC今日进展同步（2026/06/05）：  
  
网页呈现POC进展（已接入经营系统）  
经营系统：https://gpubiz.woa.com/poc-daily  
  
[太阳]新增售卖：  
「南山政数局」新增购买160卡全国产海光BW1000  
「idea」新增购买256卡BW1000，累计512卡  
「小红书」累计下单达到1080卡P800  
  
[太阳]主要进展：  
1.【长安】：  
昆仑芯：已经在P800上跑通长安自研的5个模型，正在进行多机测试与精度对齐。同时排查16机网络带宽问题，避免读取速度受限，适配全新的世界模型并完成单机测试，进行世界模型loss对齐；  
海光：5 个模型大部分测试完成，端到端二阶段模型客户有调整，目前仍在测试 2 机性能。vla 、世界模型、mo 模型优化中，剩余两个模型客户主导适配调优，未提供数据和代码。  
2.【无垠科技】：sglang框架，性能当前A800持平，客户当前认可当前性能；vl+llm模块还在优化中，单卡性能可以达到A800的80%，多卡性能还需要继续优化，客户需求在六月中旬前上量；  
3.【小红书】：Qwen3.5-397B和kimi2.5性能客户认可模型性能；新需求模型：GLM5.1、kimi2.6数据已经跑出，DS-V4 pro在跑数据；持续上量中  
4.【灵初智能】：海光BW1000:四机、八机训练任务已完成，符合预期；客户预计月中购买。外租注册节点ti-one纳管，已提需求，数据需要传输郑州超算。  
  
[太阳]主要TODO：  
1.【小红书】：模型测试与新模型测试@alexsang  
2.【无垠科技】：模型性能优化付@kehuanfeng  
3.【酷睿程】：训练和推理模型测试@xuejiangong  
4.【灵初智能】：海光多机训练测试@kehuanfeng

vault add cvm  
算电协同调度项目进展：  
1、赤峰园区已建成100%绿电直连园区，依托该试点开展IDC负荷灵活性潜力、成本等相关测试，并作为成功案例，助力各利益相关方理解算电协同模式。  
2、已打通【园区电力】->【云资源可用计划】->【算力调度】的全流程自动化链路，成功验证以电力信号为导向的算力调度方案的可行性。  
（From 阿强）

vault add cvm  
  
目前有两个方向的探索实验：  
1、为了使园区电力功耗更好地拟合风光电力的曲线，跟SSV一起在探索求解算法的实验，目前在线性规划求解（cvxpy）和均值守恒插值（emd）两个求解算法上做调优，实现更灵活的功耗拟合电力的调度。  
2、我们与中科大合作探索基于时序模型的算力需求预测，预测未来在线算力的需求，更好地计算出电力富余量用于额外调度算力，为未来在怀来等正式园区算电调度奠定技术基础。  
  
(From 阿强)

vault add gpu  
  
6月我们到底能拿到多少昆仑芯？为什么一线还是不知道我们有什么国产卡，什么时候能到？  
  
昨天晚上收到通知6月份会有1048卡昆仑芯，我们正在匹配用户需求，今天给出分货意见。目前获得的资源是严重不足需求的，大概每个月需要5000卡昆仑芯左右，5月份分了900卡  
  
我们目前外部寻源租不同的卡型大概有6000+。老板提到的海光郑州已经租了2000，还在进一步联系行业做适配，这部分卡有个问题是cpu和内存的配比都很低，导致很多场景效率提不上去  
  
现在我们也在各个行业去跑，从技术上和业务连续性上说服客户去使用小卡和国产卡，会发现一些新的机会。另外也在国内外寻找租卡的机会。最近也刚匹配了少量沐曦的需求。但是整体缺口还是非常大，每个月稳定需求有4000国产卡和10000推理n卡