跳到主要内容

资源监控

应用信息

  1. Catalog点击右上角资源中心,进入资源中心。点击 应用管理 菜单,进入应用管理 模块。 该模块可以查看当前租户已经开通的“LM Lab”, “Inference” 和 “Alaya Studio”等应用列表。可以查看应用的名称,资源使用率包括GPU、内存、CPU、存储等资源使用情况,运行时间包括启动时间和已经运行时间,运行状态等。

    应用列表(Lite)

应用监控

在每个应用,可分别对应用中的资源使用状态进行监控。

  1. 点击应用所在行的 监控按钮可查看 Kubernetes监控。查看的监控信息包括:内存使用率,GPU使用率,CPU使用率,文件系统使用率,网络I/O使用状态等。

    监控

  2. 点击右上角的 查看 Kubernetes容器组监控, 查看应用内的容器组资源使用状况。查看的监控信息包括:内存使用率,GPU使用率,CPU使用率,网络I/O使用状态等。通过筛选,可以查看一个节点上的容器组的资源进行查看。

    容器监控

弹性容器集群资源监控

Catalog点击右上角资源中心,进入资源中心。点击 弹性容器集群 菜单,进入弹性容器集群 模块。弹性容器列表中包含:运行时间包括启动时间和已经运行时间,运行状态等

由弹性容器集群的列表进入弹性容器集群的详情,进入详情之后的,可以看到弹性容器集群的 GPU、MEM、 CPU的使用率

image-20241225103204321

提示

使用率为当前弹性容器集群所消耗资源/弹性容器集群所占有的总资源