中国人一向是喜欢折中的,当你先发布一个很高的价格,之后再降价的话,大家依旧是认为你让利给大家。
君子论迹不论心,无论你是不是顶级阳谋,你只要够便宜什么都不是问题。
deepseek-v4-pro 模型 API 价格将于北京时间 2026/05/31 23:59 结束 2.5 折优惠活动后,正式调整为原定价的 1/4
同时调整的还有限速,顶级的PRO模型限速是500,较低一级的FLASH限速为2500。
一个请求从发出后,到模型响应完成之前记为一个并发,并发限制以账号粒度计,与 API Key 无关。
对于一个账号,在并发限度内,您的 API 请求都会得到响应;超过并发限度时,您会收到 HTTP 429 错误码。
这个限制几乎不存在,并发500的额度墙足够绝大多数用户使用。
纵观真个DeepSeek的API调用价格,整体上呈现下降趋势,越来越便宜。
V3始源





V4时代
| 模型 | deepseek-v4-flash | deepseek-v4-pro | |
| BASE URL (OpenAI 格式) | https://api.deepseek.com | ||
| BASE URL (Anthropic 格式) | https://api.deepseek.com/anthropic | ||
| 模型版本 | DeepSeek-V4-Flash | DeepSeek-V4-Pro | |
| 思考模式 | 支持非思考与思考模式(默认) | ||
| 上下文长度 | 1M | ||
| 输出长度 | 最大 384K | ||
| 功能 | Json Output | 支持 | 支持 |
| Tool Calls | 支持 | 支持 | |
| 对话前缀续写(Beta) | 支持 | 支持 | |
| FIM 补全(Beta) | 仅非思考模式支持 | 仅非思考模式支持 | |
| 价格 | 百万tokens输入(缓存命中)(2) | 0.02元 | 0.025元(2.5折) |
| 百万tokens输入(缓存未命中) | 1元 | 3元(2.5折) | |
| 百万tokens输出 | 2元 | 6元(2.5折) | |

Comments NOTHING