九章智算云

弹性容器集群 (VKS)

弹性容器集群(Virtual Kubernetes Service,VKS) 是九章智算云提供的托管 Kubernetes 服务,原生支持 GPU 调度、跨节点 RDMA、共享 / 动态存储与服务发布,让训练与推理工作负载真正按需调用 GPU。

核心能力

  • GPU 资源:H800 / L40S 等多种型号,标签化申请,按 GPU 数量比例分配 CPU 与内存。
  • 跨节点 RDMA:内置 IB / RoCE,YAML 中一行 rdma/rdma_shared_device_a 即可启用。
  • 持久化存储:静态 PVC 多账号共享 + 动态 PVC 按需声明,屏蔽底层 NAS / 块存储细节。
  • 服务发布:内置 ServiceExporter,自动生成公网域名,无需额外申请负载均衡。
  • 多租户:主账号统一授权管理,独享集群支持用户级并行度与消纳规则。

学习路径

进阶实践

下面这些是 VKS 上的常用扩展场景,文档放在了实践库里:

VKS vs CCI

CCI 适合单容器临时跑任务;VKS 适合多容器、多服务、需要编排的平台化场景。两者底层共用同一套 GPU 资源池,可混合使用。

最后更新于

这篇文档对你有帮助吗?

目录