跳到主要内容

创建Workshop

Workshop作为Aladdin插件的编码开发环境,本质上是用户通过本地VS Code连接远程服务器启动Pod进行应用程序的开发、测试与调试。系统可根据任务需求自动调度计算资源,并动态分配GPU实例,避免资源闲置与长时间占用,从而有效提升资源利用率,降低整体使用成本。

前置条件

用户已登录Aladdin开发平台,如需帮助可参看登录Aladdin章节所示。

操作步骤

以VS Code为例,企业账户创建Workshop的操作步骤如下所示。

操作详情

  1. 用户登录Aladdin,单击“Back to workspace”按钮,进入功能区页面,单击WORKSHOP功能区的alt text菜单项,进入参数配置页面,如下图所示。

    alt text

  2. 根据页面提示配置对应的参数,参数说明如下表所示。

    参数名称说明备注
    Environment当前Workshop使用的容器镜像,通常包含预装软件和基础运行环境支持用户选择自定义环境(1)
    Resource当前Workshop启动时分配的CPU和内存资源系统可自动适配的CPU、内存,该资源与GPU运行时的资源共享(2)
    VKS用户已创建的弹性容器集群,展示当前登录账号下所有的弹性容器集群用户可创建多个弹性容器集群(3)
    Namespace用户已选择的弹性容器集群内创建的命名空间支持选择default
    ENV当前Workshop运行时的环境变量可配置应用参数、API密钥等敏感信息(4)
    PVC MOUNTS挂载的SubPath填写开通弹性容器集群时在“文件存储”目录下新建的文件夹名称;ContainerPath填写工作路径。支持用户自定义挂载路径(5)

参数说明

(1)支持用户选择自定义环境:用户上传自定义环境的步骤可参考构建镜像示例,上传完成后即可在环境处查看对应的环境,例如下图所示。

alt text

(2)系统可自动适配的CPU、内存,该资源与GPU运行时的资源共享:用户可根据实际需求选择不同的资源配置方案:例如,在进行大规模数据处理时,可选择较高配置以提升处理效率;而在使用Workshop进行模型训练任务(如编码任务)时,则可根据需要选择较低的资源配置,以实现资源的高效利用。

(3)用户可创建多个弹性容器集群:用户创建弹性容器集群的操作步骤可参看开通弹性容器集群,创建完成后,在此处即可选择。

(4)可配置应用参数、API密钥等敏感信息:用户可以键值对形式配置程序运行的环境变量,若设置key=export HF_HOME,value=/mnt/models,则在Workshop创建的Pod处于Running状态时,该环境变量将持续有效。

(5)支持用户自定义挂载路径:用户可挂载自定义PVC路径,SubPath是PVC具体的子目录(可以为空)或文件,ContainerPath则指定了子目录或文件在容器内部挂载的具体位置,详细说明如下所示,示例页面如下图所示。

  • pvc-capacity-userdata:用户可读可写,用户可配置当前Workshop创建时已关联弹性容器集群下的目录及文件。

  • pvc-capacity-share: 用户只读,用户可配置当前登录企业存储根目录下的文件和文件夹。

  • pvc-capacity-app:用户只读,用户可配置已开通应用(Inference,LM Lab)即“文件存储/System”下的目录及文件。

    alt text

提示
  • 为保障用户数据的持久化存储,建议在创建Workshop时挂载持久卷(PVC),有效避免因Workshop重启或关闭而造成的数据丢失问题。
  • 若用户未提前创建SubPath,系统可根据其填写的SubPath参数自动在对应目录下创建键入的路径。例如:目标目录为 /mnt/,用户传入的SubPath参数为logs,若该路径不存在,系统将自动创建/mnt/logs
  1. 参数配置完成后,单击“Submit”,在弹出的新窗口(后文统称远端页面)选择"Linux",远端页面将自动安装相关插件,待远端页面中出现Remote Aladdin插件图标,Workshop创建操作完成,Workshop状态详情及描述如下所示。

    状态说明计费说明
    StoppedWorkshop处于停止状态,用户可执行Start、Edit、Delete等操作不消耗算力,不计费
    StartingWorkshop启动中,用户可执行Stop等操作按算力消耗计费*
    Running Workshop运行中,用户可执行Open、Edit、Stop、Save Env、Install Remote等操作按算力消耗计费
    StoppingWorkshop正在停止中Pod回收中,不计费
    FailedWorkshop启动时资源不足Pod未启动,不计费
信息

*:当Workshop处于Starting状态时,表示系统正在启动Pod及相关程序。在此阶段,若出现如ImagePullBackOff等异常情况,系统不计费;一旦Pod进入Running状态后,若因内存溢出(OOM)或程序错误等原因导致Workshop启动失败,系统计费。

Workshop/Session状态机

Workshop/Session状态对应的Pod状态机示意图如下所示。

alt text

  1. 成功创建Workshop后,单击“File/Open Folder”菜单项进入工作路径选择窗口。在此窗口中,选择Aladdin的工作路径(例如:“/workspace”)。如下图所示,选定工作路径后,用户即可在此目录下开始进行编码及其他相关工作。

    alt text

    重要

    若用户未挂载PVC MOUNTS,建议将/root目录作为工作目录使用,该目录已配置数据持久化功能,即使关闭或重启Workshop,数据仍可保留。若使用其他目录,则数据仅在当前运行的Workshop实例中有效,重启或关闭后数据将丢失。