从零开始:使用SGlang私有化部署满血版DeepSeek-R1实战指南
背景介绍
DeepSeek-R1是一款拥有671B参数规模的推理大模型,其在数学、编程和推理等复杂任务上的表现,已经与当前主流商业大模型不相上下。
本文详细介绍如何使用SGlang作为分布式推理方案,并基于Alaya NeW算力云的弹性容器集群,展示DeepSeek-R1私有化部署的最佳实践。通过这种组合,我们旨在提供一个灵活、可扩展且高性能的解决方案,以支持深度学习模型的高效部署与运行。这一 方法不仅提升了模型推理的效率,还确保了在私有化环境下的稳定性和安全性。
准备工作
配置环境变量
本次部署会用到 helm
和 Kubernetes
,请先确保本地有可用的Kubernestes客户端工具kubectl,此次的最佳实践以Windows 11
系统添加环境为例,配置环境变量的操作步骤如下所示。
-
通过以下网址下载最新版本的kubectl,本实践下载“windows-amd64-v1.27.3-kubectl.exe”文件,在本地新建“kubectl”文件夹,将下载的
.exe
文件名称修改为“kubectl”并移动到新建的文件夹下,如果用户需要获取其他版本安装包可通过以下网址获取安装kubectl命令行工具。 -
通过以下网址下载最新版本的helm。本实践下载“helm-v3.17.1-windows-amd64.zip”文件,在本地解压上述文件,将文件名修改为“helm”,如果用户需要获取其他版本安装包可通过以下网址获取helm。
-
右键点击[此电脑/属性]菜单项,进入[系统/系统信息]配置页面,点击“高级系统设置”链接。
-
在[系统属性]页面中,点击[环境变量]按钮,进入环境变量配置页面。
-
在“系统变量”处双击
Path
变量新建环境变量,新建如下图所示的环境。新建完成后,单击[确定]按钮,配置环境变量操作完成。
- 在实际的使用中,用户需要将上图中高亮部分替换为“kubectl.exe”、“helm.exe”文件所在的本地路径。
- Linux系统配置环境变量:将helm文件移动到目录“ /usr/local/bin”。
配置弹性容器集群
DeepSeek-R1模型的参数规模为6710亿,模型的文件大小约为642G。因此,在部署前需要准备足够的资源,用户需要保证资源至少满足下表中的配置要求。
配置项 | 配置需求 |
---|---|
GPU | H800 * 16 |
CPU | 128核 |
内存 | 512GB |
磁盘 | 1TB |
开通弹性容器集群可参看弹性容器集群开通及管理