跳到主要内容

导入模型简介

平台支持多种大模型导入方式,从FTP、对象存储等外部存储系统、HTTP方式、开源社区Hugging Face等方式下载,本地上传大模型,以及从AI Market添加的大模型,实际的物理数据文件会保存在APS集群中,如下所示:

模型导入方式使用限制说明
本地导入格式:zip上传本地模型文件
FTP先在数据源中与FTP地址连接将FTP文件地址中的模型下载并存储
对象存储先在数据源中与对象存储的服务器连接将Bucket中的模型下载并存储
HTTP先与HTTP服务器连接将HTTP链接中的模型下载并存储
Hugging Face先与Hugging Face服务器连接将Hugging Face中的模型下载并存储
路径先与文件管理或本地电脑路径连接将文件管理或本地电脑路径中的模型下载并存储
AI Market模型AI Market模型对所有服务可见,但只有在服务中添加后才可以进行使用

场景描述

将FTP的“LLM_Model”模型导入到服务“LLM Chat服务”中。

前提条件

  • 先在数据源中与FTP地址连接。

操作步骤

  1. 在“模型仓库”主界面,选择服务“LLM Chat服务”,进入该服务主页面。

  2. 在页面左侧的“侧边栏”区域,选择模型管理,系统跳转到模型管理列表页面。

  3. 在“模型管理”列表页面,单击添加模型

  4. 选择导入方式为“数据源-FTP”,输入“模型目录/文件”并测试成功。

    image

  5. 单击提交,系统提示导入结果。用户可选择查看模型导入进度,或继续添加模型。如下所示:

image

  1. 单击模型列表,系统跳转到模型管理列表页面,查看模型导入状态。

image

后续操作

导入成功的模型将进入待审核列表,通过审核后会用于在线服务。

在完成模型导入配置后,在模型管理页面,页面右侧的任务记录处会有“运行中”+“数字”的状态提示。任务记录列表里主要包括如下三部分内容:
1) 模型名称,用于标识导入后的模型。
2) 来源,显示模型的导入方式,通过Tootip可显示模型地址或名称。
3) 导入状态,支持对任务进行终止、重试、查看操作。

[!Tip]

  • 模型转换:租户采用海飞科GPU时,需先将模型进行转换,转换成功并通过审核的模型可以进行部署。