环境管理
环境简介
环境为在线服务、跑批服务、模型管理、模型监控等提供运行时的Python环境。环境管理则提供了Python环境的构建和管理功能:用户可以基于系统已有环境构建星环或直接新建环境,新建环境时需要选择依赖的镜像。用户可以根据自己特定的需求,在环境中安装特定的Python库、特定的服务,从而在其它模块中引用已构建的环境。
-
环境具有构建状态,仅构建成功的环境可以其他模块引用。服务中的环境,只能被其所在服务的其它模块引用;AI Market中的环境,可以在所有服务中进行引用。
-
平台预置了多种环境,分别依赖于不同的镜像:
-
torch2.1.2+transformers4.38.2_py310:依赖于 Ubuntu20.04_x86_cuda11.8 镜像,适用于在 NVIDIA GPU 上进行大语言模型、PyTorch 深度学习训练和推理, Python 版本 3.10,包括 torch2.1.2+cu118、transformers4.38.2、deepspeed、accelerate、opencv-python、onnx、scikit-learn 等常见库
-
tensorflow2.14.1_py310:依赖于 Ubuntu20.04_x86_cuda11.8 镜像,适用于在 NVIDIA GPU 上进行 TensorFlow 深度学习训练和推理, Python 版本 3.10,包括 tensorflow2.14.1+cu118、opencv-python、onnx、scikit-learn 等常见库
-
scikit-learn1.4.1_py310:依赖于 Ubuntu20.04_x86_cuda11.6 镜像、 Ubuntu20.04_c86_dtk23.10 镜像和 Ubuntu20.04_FT2500 镜像,适用于机器学习训练和推理, Python 版本 3.10,包括 scikit-learn、pandas、numpy、lightgbm、xgboost、catboost 、dask等常见机器学习库。在x86架构下也适用于 lightgbm、xgboost、catboost 在 NVIDIA GPU 上进行加速训练
-
hypergbm_py310:依赖于 Ubuntu20.04_x86_cuda11.6 镜像和 Ubuntu20.04_FT2500 镜像,适用于 HyperGBM 框架的训练和推理, Python 版本 3.10,包括 hypergbm、scikit-learn、pandas、numpy、dask等常见机器学习库
-
deeptables_py310:依赖于 Ubuntu20.04_x86_cuda11.6 镜像,适用于在 NVIDIA GPU 上进行 DeepTables 框架的训练和推理, Python 版本 3.10,包括 deeptables、tensorflow、scikit-learn、pandas、numpy、dask等常见机器学习库
-
torch2.1.0+transformers4.38.2_py310:依赖于 Ubuntu20.04_c86_dtk23.10 镜像,适用于在海光 DCU 上进行大语言模型、PyTorch 深度学习训练和推理, Python 版本 3.10,包括 torch2.1.0、transformers4.38.2、deepspeed、accelerate、opencv-python、onnx、scikit-learn 等常见库
-
torch2.1.0+transformers4.38.2_py37:依赖于 Ubuntu20.04_kunpeng920_cann7.0.0 镜像,适用于在昇腾 910B NPU 上进行大语言模型、PyTorch 深度学习训练和推理, Python 版本 3.7,包括 torch2.1.0 、transformers4.38.2、deepspeed、accelerate、opencv-python、onnx、scikit-learn 等常见库
-
scikit-learn1.4.1_py37:依赖于 Ubuntu20.04_kunpeng920_cann7.0.0 镜像,适用于机器学习训练和推理, Python 版本 3.7,包括 scikit-learn、pandas、numpy、lightgbm、xgboost、catboost 、dask等常见机器学习库
-
创建环境
场景描述
在服务“Doc-机器学习-模型文件”中创建一个名为“New environment”的环境。
前提条件
- 已完成服务的创建。
操作步骤
- 在“模型仓库”主界面,选择服务“Doc-机器学习-模型文件”,进入该服务主页面。
- 在页面左侧的“侧边栏”区域,选择环境管理,系统跳转到“环境”列表页面。
- 在环境列表页面,单击右上角新建按钮。
- 在新建环境页面中,填写相关参数,如下图所示:
参数说明如下:
- 环境名称:用于标识一个环境。
- 简介:环境的描述信息。
- 创建方式:选择“直接创建”或“基于已有环境创建”。
- Python版本:选择Python版本。
- 基础环境:当选择“基于已有环境创建”时,需要选择基础环境,用于构建新环境。
- 镜像:用于构建新环境的基础镜像。
- 点击提交,完成环境的新建。 新创建的环境处于“未构建”状态。
构建环境
场景描述
通过在基础环境/镜像中安装Python包来构建“New environment”环境。
前提条件
- 已完成环境的创建。
操作步骤
-
在“模型仓库”主界面,选择服务“Doc-机器学习-模型文件”,进入该服务主页面。
-
在页面左侧的“侧边栏”区域,选择环境管理,系统跳转到“环境管理”列表页面。
-
在环境列表页面,单击“New environment”,进入环境设计页面。
参数说明如下:
-
管理面板:包括文件管理、测试、包管理、python版本。其中文件管理,用于管理构建工作空间中的文件,可以上传、新建文件夹或文件;测试,用于测试环境是否可用;包管理,用于查看环境已安装的各类包,也可以快速生成新包的安装指令;python版本:用于查看环境中安装的Python版本。
-
文件查看器。可以查看、编辑文件管理面板下的文件,特别实现对shell文件的查看、编辑功能。
-
日志查看。用于查看构建过程中的日志内容。
-
基础镜像:显示此环境的基础镜像。
-
提供三种方式安装包构建新的环境:包管理、上传包文件、从指定源地址拉取包。以通过包管理安装为例,单击包管理。
-
通过包管理生成Shell命令。
安装DateTime包,DateTime提供了日期和时间的一些操作功能。
在展开的面板中单击“仓库”,并在搜索框中输入“DateTime”,进行搜索。
- 单击“生成安装命令”。
- 单击“生成shell命令”,查看“安装命令”和“卸载命令”。
- 单击“同步到shell”,上述命令会被同步到shell文件中。
- 单击页面右上角的构建图标,开始环境的构建。
在构建过程中,shell为不可编辑状态。
7. (可选)测试环境。
可以通过编写测试文件(test.py)或者上传自定义测试文件测试构建完成的环 境是否可用,单击右上角的“测试”图标进行测试。测试功能使用前提是环境已构建成功。
- (可选)共享环境。
- 单击页面右上角的“共享”图标,可以将已构建的环境共享到AI市场,此时,将在“AI市场” > “环境”中生成新环境,并可以在所有服务中进行引用。
【上传包文件】
在文件管理中文件夹位置右键点击上传文件,上传本地Python包,编辑安装命令后,点击构建。
【指定源地址】
在shell中指定包的地址源拉取安装,点击构建。
后续操作
完成环境构建后,可以在在线服务、跑批服务、模型管理、模型监控中引用该环境,由于该环境已经预装了相应的库等,从而用户可以在启动环境后,直接开始相关的任务或服务。