九章智算云

产品使用

九章智算云有哪些产品和服务?

核心算力产品

  • 算力包 —— 以DCU(Data Computing Unit,"度")为计量单位的弹性高性能算力产品。1DCU=312TFLOPS×1小时,支持按需消费、动态扩缩。分为任我选订阅算力包任我享算力包两种形式,详见算力包对比

算力交付服务

  • 弹性容器集群VKS —— 多机多卡、高速网络互联的Kubernetes集群,适用于大模型训练等高性能任务。
  • 云容器实例CCI —— 轻量级、快速启动的容器化计算环境,适合推理与开发场景。

完整产品矩阵参见产品家族

大模型可以用来做什么?有应用案例参考吗?

平台已经收录多个最佳实践,涵盖训练、微调、推理、Agent开发等典型场景:

更多案例见实践教程总览

弹性容器集群 VKS

VKS的计费规则是什么?

VKS是Alaya NeW提供的共享资源池服务,采用DCU按需计费

  • 仅对实际运行的计算任务计费,环境配置、数据传输等不计费。
  • 集群启动后,未使用GPU时仅存储消耗少量算力;只有配置并使用GPU的任务才会产生主要算力消耗。
  • 支持按需消费、实时扣费,无使用时不收费。

不同GPU型号的DCU消耗速率、存储计费标准等详细规则,参见计费总览DCU明细

如何释放VKS?

  1. 进入产品概览,点击集群管理进入集群列表。
  2. 找到目标集群,点击集群名称链接进入集群详情页面。
  3. 在操作区点击停止释放集群。

如释放失败,可通过官网在线咨询提交工单,附上账号信息(用户名、手机号、邮箱)与VKS ID。

使用H800A / H200 / L40S等资源,应该在哪个区开通?

L40s、H200等高性能算力资源在多区域均有部署。具体可用区域受账号权限、资源实时库存等因素影响,无固定答案。

为匹配最优区域,建议通过官网在线咨询提交以下信息由后台查询:

  • 需要的GPU型号与卡数
  • 预计使用时长
  • 是否有区域偏好(数据合规、就近接入等)

云容器实例 CCI

CCI主要应用场景是什么?

CCI(Cloud Container Instance)是基于Kubernetes的Serverless容器服务,典型场景:

场景说明
AI推理部署轻量级、高响应的AI推理服务,支持LLM、CV、NLP模型在线推理,可按请求量弹性伸缩。
模型快速验证无需管理底层集群,提供镜像即可秒级启动,适合算法工程师快速测试。
微服务与Web应用部署前后端分离的Web服务、API、可视化面板,支持同时暴露最多10个端口。
弹性短任务按DCU实际消耗计费,无闲置成本,适合间歇性、突发性或短期任务。
数据预处理启动无GPU的CCI实例挂载存储(如PVC),用于上传、解压、预处理等。

详见CCI简介

CCI的计费规则是什么?

CCI采用Serverless架构,按实际资源消耗按秒计费,关机即停。

资源计费方式
GPU按所选GPU型号的DCU/卡时计费。
CPU(单独使用)0.025DCU/核时。
CPU(搭配GPU)免费。
存储(NAS/混闪-OSS等)按配置容量计费,只要存储未释放就持续计费,即使任务已停止。

详细计费表参见计费总览

CCI无法关机怎么办?

可能原因:

  1. 任务仍在运行 —— 容器内有前台进程未退出(如Jupyter、训练脚本)。
  2. 平台延迟 —— 高负载时段关机指令短暂延迟。
  3. 权限或界面问题 —— 当前账号无操作权限,或控制台页面未刷新。

排查建议:

  • 通过SSH登录CCI实例,手动kill主进程后再关机。参见SSH进入CCI

  • 在控制台尝试强制停止/删除实例

    强制删除会丢失未持久化的数据(未挂载持久化存储的容器内文件)。如有重要数据,请先备份至PVC或对象存储。

  • 仍无法解决,通过官网在线咨询提交工单,附上:账号信息、CCI实例ID、具体现象(按钮无响应/状态卡住等)。

最后更新于

这篇文档对你有帮助吗?

目录