九章智算云

容器组(Pods)详情

容器组(Pods)是极核训练任务的最小运行单元,每个任务由一个或多个Pod组成。通过容器组详情页,您可以实时查看Pod的运行状态、资源使用情况、环境配置等信息,同时支持通过Web连接、开放端口等方式直接访问容器内部,方便进行调试、日志查看和应用访问。

访问方式

登录九章智算云平台,单击顶部导航栏产品中心/计算/极核训练菜单项,进入极核训练任务列表页面。 企业注册

在任务列表页,单击任务名称进入任务详情,然后切换至容器组(Pods)标签页,即可查看该任务下的所有Pod列表。每个Pod卡片展示关键信息,包括Pod名称、状态、节点、IP地址等。

平台提供以下两种方式访问容器组内部:

方式一:Web连接

单击Pod卡片上的Web连接按钮,可直接在浏览器中打开容器内部的Web服务(如JupyterLab、TensorBoard等),无需额外配置即可快速访问。

Pod列表

方式二:配置访问端口

如需通过特定端口访问容器内应用(如自定义的HTTP服务、调试端口等),可单击开放端口按钮,填写容器端口和访问协议,系统将自动生成可访问的外网地址。

企业注册

Pod详情

在容器组列表页,单击任意Pod名称即可进入该Pod的详情页面。详情页以多标签形式展示Pod的全方位信息,帮助您深入了解容器的运行状态和配置详情。

基本信息

  • 核心元数据:基本信息模块展示容器组的核心元数据,包括集群归属标识、Kubernetes命名空间、当前运行状态、容器组内部IP地址、启动时间戳、所在节点名称及IP地址、重启次数计数,以及QoS服务质量等级(如Guaranteed表示最高优先级资源保障)。 企业注册

  • YAML配置:支持查看该Pod的完整Kubernetes YAML定义文件,包含所有配置细节。您可以复制YAML内容用于本地调试或作为配置备份。

    企业注册

资源状态

直观展示Pod的资源使用情况和挂载信息:

  • 容器信息:各容器的镜像版本、资源请求/限制、端口映射、重启次数等。

  • 卷信息:已挂载的存储卷列表,包括存储类型、卷名称、挂载路径及容量使用状况。 企业注册

  • 容器日志:实时查看容器输出的标准输出(stdout)和标准错误(stderr)日志,支持: 企业注册

  • 容器终端:通过容器终端可直接在容器内执行Linux命令,进行调试诊断、查看系统状态、临时修改配置或手动触发脚本任务。

    容器终端

调度信息

调度信息全面展示Pod从创建到运行的完整调度轨迹,包括调度器分配决策、节点亲和性规则、资源分配依据以及调度异常与重试记录。

企业注册

环境变量

环境变量模块完整展示容器内所有环境变量的键值对信息,涵盖用户在创建任务时自定义的环境变量、平台自动注入的系统级变量、与存储卷挂载路径相关的路径变量,以及用于服务发现的网络配置变量。 企业注册

事件

事件模块以时间线形式完整记录Pod生命周期中的关键节点,包括创建启动停止状态变更、镜像拉取进度与结果、容器重启触发记录、健康检查失败告警以及资源不足等异常事件,帮助用户快速定位故障根因。

企业注册

最后更新于

这篇文档对你有帮助吗?

目录