九章智算云

产品使用

九章智算云有哪些产品和服务?

核心算力产品

  • 算力包 —— 以 DCU(Data Computing Unit,"度")为计量单位的弹性高性能算力产品。1 DCU = 312 TFLOPS × 1 小时,支持按需消费、动态扩缩。分为 任我选订阅算力包任我享算力包 两种形式,详见 算力包对比

算力交付服务

  • 弹性容器集群 VKS —— 多机多卡、高速网络互联的 Kubernetes 集群,适用于大模型训练等高性能任务。
  • 云容器实例 CCI —— 轻量级、快速启动的容器化计算环境,适合推理与开发场景。

完整产品矩阵参见 产品家族

大模型可以用来做什么?有应用案例参考吗?

平台已经收录多个最佳实践,涵盖训练、微调、推理、Agent 开发等典型场景:

更多案例见 实践教程总览

弹性容器集群 VKS

VKS 的计费规则是什么?

VKS 是 Alaya NeW 提供的共享资源池服务,采用 DCU 按需计费:

  • 仅对实际运行的计算任务计费,环境配置、数据传输等不计费。
  • 集群启动后,未使用 GPU 时仅存储消耗少量算力;只有配置并使用 GPU 的任务才会产生主要算力消耗。
  • 支持按需消费、实时扣费,无使用时不收费。

不同 GPU 型号的 DCU 消耗速率、存储计费标准等详细规则,参见 计费总览DCU 明细

如何释放 VKS?

  1. 进入 产品概览,点击 集群管理 进入集群列表。
  2. 找到目标集群,点击集群名称链接进入 集群详情 页面。
  3. 在操作区点击 停止释放 集群。

如释放失败,可通过官网在线咨询提交工单,附上账号信息(用户名、手机号、邮箱)与 VKS ID。

使用 H100 / H200 / L40S 等资源,应该在哪个区开通?

L40s、H200 等高性能算力资源在多区域均有部署。具体可用区域受账号权限、资源实时库存等因素影响,无固定答案。

为匹配最优区域,建议通过官网在线咨询提交以下信息由后台查询:

  • 需要的 GPU 型号与卡数
  • 预计使用时长
  • 是否有区域偏好(数据合规、就近接入等)

云容器实例 CCI

CCI 主要应用场景是什么?

CCI(Cloud Container Instance)是基于 Kubernetes 的 Serverless 容器服务,典型场景:

场景说明
AI 推理部署轻量级、高响应的 AI 推理服务,支持 LLM、CV、NLP 模型在线推理,可按请求量弹性伸缩。
模型快速验证无需管理底层集群,提供镜像即可秒级启动,适合算法工程师快速测试。
微服务与 Web 应用部署前后端分离的 Web 服务、API、可视化面板,支持同时暴露最多 10 个端口。
弹性短任务按 DCU 实际消耗计费,无闲置成本,适合间歇性、突发性或短期任务。
数据预处理启动无 GPU 的 CCI 实例挂载存储(如 PVC),用于上传、解压、预处理等。

详见 CCI 简介

CCI 的计费规则是什么?

CCI 采用 Serverless 架构,按实际资源消耗按秒计费,关机即停。

资源计费方式
GPU按所选 GPU 型号的 DCU/卡时计费。
CPU(单独使用)0.025 DCU/核时。
CPU(搭配 GPU)免费。
存储(挂载 NAS / 对象存储等)按配置容量计费,只要存储未释放就持续计费,即使任务已停止。

详细计费表参见 计费总览

CCI 无法关机怎么办?

可能原因:

  1. 任务仍在运行 —— 容器内有前台进程未退出(如 Jupyter、训练脚本)。
  2. 平台延迟 —— 高负载时段关机指令短暂延迟。
  3. 权限或界面问题 —— 当前账号无操作权限,或控制台页面未刷新。

排查建议:

  • 通过 SSH 登录 CCI 实例,手动 kill 主进程后再关机。参见 SSH 进入 CCI

  • 在控制台尝试 强制停止 / 删除实例

    强制删除会丢失未持久化的数据(未挂载持久化存储的容器内文件)。如有重要数据,请先备份至 PVC 或对象存储。

  • 仍无法解决,通过官网在线咨询提交工单,附上:账号信息、CCI 实例 ID、具体现象(按钮无响应 / 状态卡住等)。

最后更新于

这篇文档对你有帮助吗?

目录