在大模型的应用当中，算力的问题，大家一直都很关心。
   过去几年，我们和不少客户在GPU卡上都有合作；同时，也通过一云多芯和软硬协同的架构，让算力资源集约化地被利用。
   上个月，我们也发布了腾讯云智算品牌，通过整合异构计算、智能高性能网络IHN、AIGC存储等优势产品，显著提升了计算资源的利用率。千卡日均故障率仅为0.16，是业界水平的1/3；1分钟就能完成万卡checkpoint写入，是业界的10倍；千卡集群的通信时间占比，也降低到6%，是业界一半。
   经过我们实测，腾讯云智算产品，在 Llama2 7B、13B、34B、70B 多个规格大模型的训练上，相比友商，性能最高可以提升30%左右。
<span style="font-family:.PingFangUITextSC-Regular;">当然我们也考虑到不同客户，对弹性、灵活性、数据隐私和自主可控的不同需求，因此把智算能力通过公有云、专有云、分布式云等多种形态输出，满足客户多种模式的灵活部署。而且整个智算集群从机器上架，到开始训练，最快只需要</span>1天就能完成。

<span style="font-family:.PingFangUITextSC-Regular;">第三，立足云智算，向上突破算力天花板，向下拉低成本。</span>
   在大模型的应用当中，算力的问题，大家一直都很关心。
   过去几年，我们和不少客户在GPU卡上都有合作；同时，也通过一云多芯和软硬协同的架构，让算力资源集约化地被利用。
   上个月，我们也发布了腾讯云智算品牌，通过整合异构计算、智能高性能网络IHN、AIGC存储等优势产品，显著提升了计算资源的利用率。千卡日均故障率仅为0.16，是业界水平的1/3；1分钟就能完成万卡checkpoint写入，是业界的10倍；千卡集群的通信时间占比，也降低到6%，是业界一半。
   这些能力大部分都来自于腾讯云多年来积累的各方面产品能力，以云原生的方式让大模型跑得更快和更稳，同时也为未来推理业务发展打下良好基础。经过我们实测，腾讯云智算产品，在 Llama2 7B、13B、34B、70B 多个规格大模型的训练上，性能最高可以提升30%左右。
<span style="font-family:.PingFangUITextSC-Regular;">当然我们也考虑到不同客户，对弹性、灵活性、数据隐私和自主可控的不同需求，因此把智算能力通过公有云、专有云、分布式云等多种形态输出，满足客户多种模式的灵活部署。而且整个智算集群从机器上架，到开始训练，最快只需要</span>1天就能完成。