DeepSeek V4 来了。

逛逛GitHub 2026-04-24 11:42 浙江

核心点:

① 百万上下文标配,全新 token 压缩 + DSA 稀疏注意力,计算量远低于传统方案

② 两个版本:V4-Pro(1.6T 参数,49B激活)和 V4-Flash(更轻更快更便宜)

③ Agent 能力开源最强,内部已替代使用,体验优于 Sonnet 4.5,接近 Opus 4.6 非思考模式

④ 推理性能超越所有已公开评测的开源模型,比肩顶级闭源

⑤ API 已上线:model 参数改为 deepseek-v4-pro 或 deepseek-v4-flash,支持思考/非思考模式

⑥ 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化

⑦ 权重开源在 HuggingFace 和 ModelScope,技术报告同步公开

⑧ 旧模型名 deepseek-chat / deepseek-reasoner 三个月后停用(2026-07-24)

怎么用:

① 在线体验:chat.deepseek.com 或官方 App

② API 调用:baseurl 不变,model 参数改为 deepseek-v4-pro 或 deepseek-v4-flash

相关链接:

① 模型权重:https://huggingface.co/collections/deepseek-ai/deepseek-v4

② 国内镜像:https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

③ 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek\_V4.pdf

④ API 文档:https://api-docs.deepseek.com/zh-cn/guides/thinking\_mode

跳转微信打开

聊天