模型管理
模型管理简介
Lab训练好并发布至服务的模型、直接导入的模型文件,从模型市场添加的模型,以及通过Docker Image和镜像仓库两种导入方式获取的镜像模型,都需要执行审核操作,并在模型管理列表进行统一管理。平台的许多功能都依赖模型管理实现,例如在线服务、跑批服务、模型评估、模型监控等。
模型管理具有如下特性:
- 模型审核和监管:对从Lab训练的模型、导入的模型或从模型市场添加的模型执行审核,确保其符合安全、隐私、合规等标准。
- 模型评估:在上线前支持对模型性能评估,包括模板评估和自定义评估。
- 模型量化:在保持模型性能的前 提下,减少模型参数的精度,以满足存储和计算需求。
导入模型
导入模型简介
导入方式支持将如下几种类型的模型导入模型仓库:
- 机器学习模型:
- DCPipeline 模型文件,适用于平台3.2或以上版本生成的基于DCPipeline的zip文件
- 复杂模型文件,适用于平台3.2以前版本通过自定义算子生成的由模型文件与modelserving.py文件组成的zip文件,详见2.4.2.3 导入复杂模型
- DeepTables 模型文件
- PMML 模型文件
- ONNX 模型文件
- 基于Sklearn的 pkl 模型文件,适用于平台3.2以前版本或Sklearn生成的pkl文件
- 深度学习模型:
- DCPipeline 模型文件,适用于平台3.2或以上版本生成的基于DCPipeline的zip文件
- 杂模型文件,适用于平台3.2以前版本通过自定义算子生成的由模型文件与modelserving.py文件组成的zip文件,详见2.4.2.3 导入复杂模型
- ONNX 模型文件
- 基于PyTorch的 pth 模型文件,详见2.4.2.2 导入单文件的pth的PyTorch模型
- 预训练模型:
- 基于TensorFlow2的 ckpt 模型文件
- 基于TensorFlow2的 h5 或 SaveModel模型文件
- 基于PyTorch的 pth 模型文件
场景描述
将从Lab模型组中导出的“DT神经网络_二分类”模型导入到服务“Doc-机器学习-模型文件”中。
前提条件
- 待导入的模型与服务 的特征形状需要一致。
操作步骤
-
在“模型仓库”主界面,选择服务“Doc-机器学习-模型文件”,进入该服务主页面。
-
在页面左侧的“侧边栏”区域,选择模型管理,系统跳转到模型管理列表页面。
-
在“模型管理”列表页面,单击添加模型。
-
选择“模型类型”为“DCPipeline 模型文件”,并将待导入的模型文件拽到文件上传区域。
-
单击下一步,系统自动解析导入的模型文件,并允许用户根据实际情况进行修改,如下所示:
-
单击下一步,确认并设置变量信息
系统从模型文件中解析的变量包括“特征变量”和“目标变量”两种。- 自动推断:系统会自动从导入的模型文件中解析模型的变量信息,当用户修改变量后,可以通过该方式将变量恢复到系统自动推断的状态。 若服务中模型非空,则导入时解析出的模型的变量需要与服务的变量一致,包括变量名称与类型,才可以导入到该服务中,若服务为空,则会将导入的第一个模型的变量作为服务的变量。
-
单击下一步,系统提示导入结果。
-
单击关闭,完成导入。