部署PyTorch实例
本文将引导用户如何使用自定义镜像在Alaya NeW弹性容器集群上部署一个PyTorch实例。通过这一过程的探索,为用户提供了在云端快速部署自定义服务的参考。无论是对于希望快速启动开发环境的开发者,还是需要将复杂应用迁移到云端的企业用户,实现高效的资源管理和开发效率提升。
前提条件
- 用户已安装命令行工具(kubectl),如用户尚未安装,Windows用户可参考VKS Tools一键安装;macOS用户可参考VKS Tools一键安装完成安装。
- 用户已安装Aladdin插件,安装步骤可参看安装Aladdin章节所示。
- 用户已开通弹性容器集群,且集群可正常使用。如尚未开通,可参考开通弹性容器集群完成开通。
操作步骤
-
点击Aladdin插件图标,进入插件登录页面,使用已注册的企业账号登录Aladdin。
-
登录完成后,返回工作区,单击
进入新建一个Workshop配置页面,填写参数,参数说明如下所示。
参数名称 说明 备注 Environment GPU运行的基础镜像 运行环境选择预置的aladdin/llamafactory公共镜像仓库下的 jupyter-lab
镜像Resource GPU调用时分配到的资源 系统自动适配的CPU、内存 VKS 用户已创建的弹性容器集群 已注册的企业账号可创建多个集群 Namespace 用户已选择的弹性容器集群内创建的命名空间 支持选择 default
ENV 环境变量配置 支持键值对形式注入 PVC MOUNTS 挂载的SubPath填写开通弹性容器集群时在“文件存储”目录下新建的文件夹名称;ContainerPath填写工作路径。 可选 -
配置完成后,单击“Submit”,在弹出的新窗口(后文统称远端页面)选择"Linux",远端页面中将自动安装相关插件,待远端页面中出现Remote Aladdin插件图标,Workshop创建操作完成。
-
按
Ctrl+Shift+P
(Windows/Linux),打开命令面板,选择Python: Select Interpreter
,可选择下图高亮所示的Python解释器。 -
选择完成后,打开“/workspace/”文件夹,如下图高亮①所示,然后选择“Terminal/New Terminal”菜单项进入终端页面,如下图高亮③所示。
-
在上述终端页面运行
bash jupyter.sh
指令,根据页面提示设置登录密码,单击选择“Open in Browser”,使用已设置的密码登录应用。 -
登录后即可访问该服务,用户可在服务页面进行开发、调试工作,示例页面如下图所示。
总结
用户通过Aladdin快速部署一个PyTorch实例,用户可参考本文的部署方法,快速实现自身服务的容器化与云端部署,提升开发效率与资源利用率。