跳到主要内容

产品简介

模型列表

为确保API的顺利购买与使用,建议用户提前完成企业账户注册。如果尚未注册,可点击 

 进行快速注册。

提示

用户登录企业账户后,进入[产品/大模型推理服务]页面,点击立即开通API服务按钮,即可快速开启大模型推理之旅,体验高效、智能的服务能力。

目前系统支持DeepSeek-R1满血版模型(FP8无量化版),用户根据不同的业务需求调用对应的模型。

DeepSeek版本参数规模(B)模型大小(约)上下文长度最大思维链长度(1)最大输出长度(2) model
DeepSeek-R1671FP8: 671GB64K32K8Kdeepseek-r1

(1) 最大思维链长度:是推理完整性与计算效率的关键参数,用户需根据具体任务和模型能力进行调整。

(2)最大输出长度:指模型生成的回复文本的最大字符数或令牌(Tokens)数量。

用户获取API Key后可直接调用相应的模型进行任务执行。例如:使用如下方式在本地调用满血版的deepseek-r1

curl --location 'https://deepseek.alayanew.com/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer <your_access_token>' \
--data '
{
"stream": false,
"messages": [
{
"role": "user",
"content": "Please generate an essay"
}
],
"model": "deepseek-r1"
}
'

功能使用

推理服务通过API调用大模型,基本流程如下所示。

计费说明

平台提供专属资源部署模型,详情用户可查看计费说明