DeepSeek-R1 API使用指南
获取访问令牌
-
用户使用https://www.alayanew.com 登录Alaya NeW官网,找到右上角“注册”按钮,如下图所示。
-
单击“注册”按钮,进入[企业注册]页面,如下图所示。根据页面提示填写注册信息,例如:用户名、邮箱、手机号、短信验证码等信息,勾选“我已阅读《用户协议》和《隐私政策》”选项。注册信息填写完成后,单击“注册”按钮。
-
登录注册时填写的邮箱,点击“点击链接设置您的初始密码”链接,设置用户登录密码。
提示
- 设置初始密码链接有效期为60分钟,用户需及时配置。如果链接超时,用户可在登录页点击“忘记密码”链接,系统会重新发送设置密码邮件。
- 如果您已有企业账号,可直接登录。
-
使用用户名和密码登录Alaya NeW平台后,悬停在右上角头像处,在弹出的窗口选择“访问管理”页签,进入访问令牌配置页面,如下图所示。
-
按照页面提示输入配置参数,例如访问令牌名称、到期时间、访问范围需勾选Inference API,单击“提交”按钮即可获取访问令牌,如下图所示。
注意
每次生成的访问令牌仅展示一次,需妥善保存。
API应用详情
支持模型列表
DeepSeek版本 | 参数规模(B) | 模型大小(约) |
---|---|---|
DeepSeek-R1 | 671 | FP8: 671GB |
DeepSeek-R1-Distill-Qwen-32B | 32 | BF16: 65.53GB |
说明
目前平台支持两种DeepSeek模型:DeepSeek-R1满血版(FP8量化版),DeepSeek-R1-Lite版(Qwen-32B蒸馏版)。
API
Post
使用指南
请求地址:http://deepseek.alayanew.com/deepseek/v1/chat/completions
请求参数
请求示例
响应参数
响应示例
参数名称 | 参数值 | 类型 | 说明 | 是否必须 |
---|---|---|---|---|
messages | [{"role": "system", "content": "You are a helpful assistent."}, {"role": "user", "content": "你好"}] | List[object] | 包含对话历史描述的消息列表。 | 是 |
model | DeepSeek-R1 / DeepSeek-R1-Lite | string | 要使用的模型。 | 是 |
temperature | 1 | float | 默认为 1。表示要使用的采样温度(temperature),介于 0 ~ 2 之间。较高的值(如 0.8)会使输出更随机,而较低的值(如 0.2)则会使其更加专注和确定。 | 否 |
top_p | 1 | float | 默认为 1。一种称为“核心采样”的采样替代方法,其中模型考虑概率质量值在前 top_p 的标记的结果。因此,0.1 意味着仅考虑概率质量值前 10% 的标记。 | 否 |
n | 1 | int | 默认为 1。要生成的每个输入消息的聊天完成选项数量。 | 否 |
stream | false | bool | 是否为流式响应。 | 否 |
stop | [] | optional[string, List] | 默认为 null。API 最多将生成 4 个序列,这些序列将停止生成更多标记。 | 否 |
max_tokens | 1024 | int | 默认为 inf,表示最大生成 token 数。 | 否 |
presence_penalty | 0 | float | 默认为 0。介于 -2.0~2.0 之间的数字。正值会根据新标记在迄今为止的文本中出现的频率惩罚新标记,增加模型谈论新话题的可能性。 | 否 |
frequency_penalty | 0 | float | 默认为 0。范围在 -2.0~2.0 之间的数字。正值会根据其在文本中的现有频率惩罚新标记,从而减少模型重复同一行的可能性。 | 否 |
logit_bias | - | dict | 默认为 null。修改出现在完成中的指定标记的可能性。 | 否 |