九章智算云

弹性容器集群(VKS)

弹性容器集群(Virtual Kubernetes Service,VKS)是九章智算云提供的托管Kubernetes服务,原生支持GPU调度、跨节点RDMA、共享/动态存储与服务发布,让训练与推理工作负载真正按需调用GPU。

核心能力

  • GPU资源:H800/L40S等多种型号,标签化申请,按GPU数量比例分配CPU与内存。
  • 跨节点RDMA:内置IB/RoCE,YAML中一行「rdma/rdma_shared_device_a」即可启用。
  • 持久化存储:静态PVC多账号共享+动态PVC按需声明,屏蔽底层NAS/块存储细节。
  • 服务发布:内置「ServiceExporter」,自动生成公网域名,无需额外申请负载均衡。
  • 多租户:主账号统一授权管理,独享集群支持用户级并行度与消纳规则。

学习路径

进阶实践

下面这些是 VKS 上的常用扩展场景,文档放在了实践库里:

VKS vs CCI

CCI 适合单容器临时跑任务;VKS 适合多容器、多服务、需要编排的平台化场景。两者底层共用同一套 GPU 资源池,可混合使用。

最后更新于

这篇文档对你有帮助吗?

目录