DeepSeek V4 价格“跳水”，AI 调用成本骤降 83%

好的，我将根据您提供的文章，为您进行重新梳理和编写。以下是根据原文内容和数据生成的改写版本：

DeepSeek V4 价格“跳水”，AI 调用成本骤降 83%

近日，DeepSeek 宣布对其 V4 系列模型 API 服务价格进行重大调整，核心是对输入缓存（Cache Hit）实施永久性一折降价，并结合阶段性促销，使得实际使用成本大幅降低，引发了行业广泛关注。

一、降价核心：缓存永久打折，叠加限时优惠

本次降价策略包含两个层面：

永久降价：即日起，DeepSeek 全系列 API 服务的“缓存命中”输入 Token 价格，永久降至原价的 1/10。
限时叠加：在永久降价基础上，针对 DeepSeek-V4-Pro 模型，在 2026 年 5 月 5 日前，额外提供 2.5 折（即 75% off）的限时优惠，形成“折上折”。

调整后价格概览（人民币/百万Tokens）：

API 访问模型名	输入 (缓存命中)	输入 (缓存未命中)	输出	上下文长度
DeepSeek-V4-Pro	0.025 元	3 元 (12元 x 2.5折)	6 元 (24元 x 2.5折)	1M
DeepSeek-V4-Flash	0.02 元	1 元	2 元	较长

注：V4-Pro 的 3 元/6 元为折后价，其原价分别为 12 元/24 元。

二、实测效果：编程任务成本下降超八成

降价的实际效果如何？文章通过一组实测数据进行了对比：

测试场景：一次 Agent 编程任务，消耗了约 3500 万 Token。
降价前成本：按照旧价格计算，总花费约为 31.73 元。
降价后成本：按照新的永久折扣价 + V4-Pro 限时折扣计算，同样任务仅需约 5.34 元。

计算结果显示，整体成本下降了约 83%，用户仅需支付原成本的约 17%。

成本骤降的原因：

输入占比高：在编程等任务中，输入的提示词（Prompt）Token 数量通常远大于模型输出的 Token 数量。
缓存命中率高：DeepSeek 的缓存优化效果显著，V4-Pro 的输入缓存命中率约 95%，V4-Flash 约 91%。这意味着绝大部分输入 Token 都能以极低的“缓存命中”价格（0.025元/百万或0.02元/百万）计费。

因此，尽管输出和缓存未命中的单价较高，但由于它们所占比例小，总成本得以大幅压缩。

三、行业影响：普惠战略与未来预期

降低使用门槛：此举被业内视为一次“普惠”行动。极低的成本将极大惠及学生、AI 初学者以及希望尝试AI集成的小型企业，降低了学习和使用长上下文、高性能 AI 模型的门槛。
引发行业震动：DeepSeek 并非首次采取激进的定价策略，其通过技术优化降低成本并反馈给市场的做法，往往能推动行业价格竞争。此次以美元计价时，单价已低至小数点后多位，对全球市场冲击力显著。
未来价格展望：文章末尾提到，由于当前高端算力有限，V4-Pro 的服务吞吐仍受限制。但预计在 2026 年下半年华为昇腾 950 超节点批量上市后，Pro 版本的价格可能还会迎来大幅下调，暗示未来仍有降价空间。

总结

DeepSeek 此次价格调整并非简单的促销，而是通过永久性大幅降低核心使用场景（缓存命中输入）的成本，结合高缓存命中率的技术优势，实现了实际使用成本降低超过 80% 的效果。这既是其“AGI for Everyone”技术理念的商业体现，也可能再次搅动 AI 大模型服务的市场竞争格局。

聊天

ai新闻

创建于 2026年4月28日

公开

访客

贡献

版主

向主理发信息

u/alive_fighter6701