DeepSeek V4 价格“跳水”,AI 调用成本骤降 83%
好的,我将根据您提供的文章,为您进行重新梳理和编写。以下是根据原文内容和数据生成的改写版本:
DeepSeek V4 价格“跳水”,AI 调用成本骤降 83%
近日,DeepSeek 宣布对其 V4 系列模型 API 服务价格进行重大调整,核心是对输入缓存(Cache Hit)实施永久性一折降价,并结合阶段性促销,使得实际使用成本大幅降低,引发了行业广泛关注。
一、降价核心:缓存永久打折,叠加限时优惠
本次降价策略包含两个层面:
永久降价:即日起,DeepSeek 全系列 API 服务的“缓存命中”输入 Token 价格,永久降至原价的 1/10。
限时叠加:在永久降价基础上,针对 DeepSeek-V4-Pro 模型,在 2026 年 5 月 5 日前,额外提供 2.5 折(即 75% off)的限时优惠,形成“折上折”。
调整后价格概览(人民币/百万Tokens):
API 访问模型名 | 输入 (缓存命中) | 输入 (缓存未命中) | 输出 | 上下文长度 |
|---|---|---|---|---|
DeepSeek-V4-Pro | 0.025 元 | 3 元 (12元 x 2.5折) | 6 元 (24元 x 2.5折) | 1M |
DeepSeek-V4-Flash | 0.02 元 | 1 元 | 2 元 | 较长 |
注:V4-Pro 的 3 元/6 元为折后价,其原价分别为 12 元/24 元。
二、实测效果:编程任务成本下降超八成
降价的实际效果如何?文章通过一组实测数据进行了对比:
测试场景:一次 Agent 编程任务,消耗了约 3500 万 Token。
降价前成本:按照旧价格计算,总花费约为 31.73 元。
降价后成本:按照新的永久折扣价 + V4-Pro 限时折扣计算,同样任务仅需约 5.34 元。
计算结果显示,整体成本下降了约 83%,用户仅需支付原成本的约 17%。
成本骤降的原因:
输入占比高:在编程等任务中,输入的提示词(Prompt)Token 数量通常远大于模型输出的 Token 数量。
缓存命中率高:DeepSeek 的缓存优化效果显著,V4-Pro 的输入缓存命中率约 95%,V4-Flash 约 91%。这意味着绝大部分输入 Token 都能以极低的“缓存命中”价格(0.025元/百万或0.02元/百万)计费。
因此,尽管输出和缓存未命中的单价较高,但由于它们所占比例小,总成本得以大幅压缩。
三、行业影响:普惠战略与未来预期
降低使用门槛:此举被业内视为一次“普惠”行动。极低的成本将极大惠及学生、AI 初学者以及希望尝试AI集成的小型企业,降低了学习和使用长上下文、高性能 AI 模型的门槛。
引发行业震动:DeepSeek 并非首次采取激进的定价策略,其通过技术优化降低成本并反馈给市场的做法,往往能推动行业价格竞争。此次以美元计价时,单价已低至小数点后多位,对全球市场冲击力显著。
未来价格展望:文章末尾提到,由于当前高端算力有限,V4-Pro 的服务吞吐仍受限制。但预计在 2026 年下半年华为昇腾 950 超节点批量上市后,Pro 版本的价格可能还会迎来大幅下调,暗示未来仍有降价空间。
总结
DeepSeek 此次价格调整并非简单的促销,而是通过永久性大幅降低核心使用场景(缓存命中输入)的成本,结合高缓存命中率的技术优势,实现了实际使用成本降低超过 80% 的效果。这既是其“AGI for Everyone”技术理念的商业体现,也可能再次搅动 AI 大模型服务的市场竞争格局。
