产品使用
九章智算云有哪些产品和服务?
核心算力产品
- 算力包 —— 以 DCU(Data Computing Unit,"度")为计量单位的弹性高性能算力产品。1 DCU = 312 TFLOPS × 1 小时,支持按需消费、动态扩缩。分为 任我选订阅算力包 和 任我享算力包 两种形式,详见 算力包对比。
算力交付服务
- 弹性容器集群 VKS —— 多机多卡、高速网络互联的 Kubernetes 集群,适用于大模型训练等高性能任务。
- 云容器实例 CCI —— 轻量级、快速启动的容器化计算环境,适合推理与开发场景。
完整产品矩阵参见 产品家族。
大模型可以用来做什么?有应用案例参考吗?
平台已经收录多个最佳实践,涵盖训练、微调、推理、Agent 开发等典型场景:
-
训练实践 —— Ray 分布式训练。
-
集成实践 —— Dify 业务数据接入。
更多案例见 实践教程总览。
弹性容器集群 VKS
VKS 的计费规则是什么?
VKS 是 Alaya NeW 提供的共享资源池服务,采用 DCU 按需计费:
- 仅对实际运行的计算任务计费,环境配置、数据传输等不计费。
- 集群启动后,未使用 GPU 时仅存储消耗少量算力;只有配置并使用 GPU 的任务才会产生主要算力消耗。
- 支持按需消费、实时扣费,无使用时不收费。
不同 GPU 型号的 DCU 消耗速率、存储计费标准等详细规则,参见 计费总览 与 DCU 明细。
如何释放 VKS?
- 进入 产品概览,点击 集群管理 进入集群列表。
- 找到目标集群,点击集群名称链接进入 集群详情 页面。
- 在操作区点击 停止 或 释放 集群。
如释放失败,可通过官网在线咨询提交工单,附上账号信息(用户名、手机号、邮箱)与 VKS ID。
使用 H100 / H200 / L40S 等资源,应该在哪个区开通?
L40s、H200 等高性能算力资源在多区域均有部署。具体可用区域受账号权限、资源实时库存等因素影响,无固定答案。
为匹配最优区域,建议通过官网在线咨询提交以下信息由后台查询:
- 需要的 GPU 型号与卡数
- 预计使用时长
- 是否有区域偏好(数据合规、就近接入等)
云容器实例 CCI
CCI 主要应用场景是什么?
CCI(Cloud Container Instance)是基于 Kubernetes 的 Serverless 容器服务,典型场景:
| 场景 | 说明 |
|---|---|
| AI 推理 | 部署轻量级、高响应的 AI 推理服务,支持 LLM、CV、NLP 模型在线推理,可按请求量弹性伸缩。 |
| 模型快速验证 | 无需管理底层集群,提供镜像即可秒级启动,适合算法工程师快速测试。 |
| 微服务与 Web 应用 | 部署前后端分离的 Web 服务、API、可视化面板,支持同时暴露最多 10 个端口。 |
| 弹性短任务 | 按 DCU 实际消耗计费,无闲置成本,适合间歇性、突发性或短期任务。 |
| 数据预处理 | 启动无 GPU 的 CCI 实例挂载存储(如 PVC),用于上传、解压、预处理等。 |
详见 CCI 简介。
CCI 的计费规则是什么?
CCI 采用 Serverless 架构,按实际资源消耗按秒计费,关机即停。
| 资源 | 计费方式 |
|---|---|
| GPU | 按所选 GPU 型号的 DCU/卡时计费。 |
| CPU(单独使用) | 0.025 DCU/核时。 |
| CPU(搭配 GPU) | 免费。 |
| 存储(挂载 NAS / 对象存储等) | 按配置容量计费,只要存储未释放就持续计费,即使任务已停止。 |
详细计费表参见 计费总览。
CCI 无法关机怎么办?
可能原因:
- 任务仍在运行 —— 容器内有前台进程未退出(如 Jupyter、训练脚本)。
- 平台延迟 —— 高负载时段关机指令短暂延迟。
- 权限或界面问题 —— 当前账号无操作权限,或控制台页面未刷新。
排查建议:
-
通过 SSH 登录 CCI 实例,手动
kill主进程后再关机。参见 SSH 进入 CCI。 -
在控制台尝试 强制停止 / 删除实例。
强制删除会丢失未持久化的数据(未挂载持久化存储的容器内文件)。如有重要数据,请先备份至 PVC 或对象存储。
-
仍无法解决,通过官网在线咨询提交工单,附上:账号信息、CCI 实例 ID、具体现象(按钮无响应 / 状态卡住等)。
最后更新于
这篇文档对你有帮助吗?
