4月24号,DeepSeek V4 终于发了。
说"终于"不是夸张。从去年底 V3 发布算起,这一年多里,"V4 什么时候出"大概是 AI 圈被问得最多的问题之一。春节说发,没发。三月说要发,又拖了。四月中旬上线了"专家模式"做灰度测试,大家都觉得快了快了——然后 4月24号,正式来了。千呼万唤始出来。
但这次 V4 并没有犹抱琵琶半遮面。一出手就是两个模型同时开源,权重直接扔上 Hugging Face,API 即刻可用,技术报告全文公开,性能数据不加滤镜——Pro 比肩顶级闭源,Flash 主打速度和成本。不玩虚的。
它不是 V3 的小版本迭代,是一个全新的代际升级。两个模型:V4-Pro 打性能天花板,V4-Flash 打性价比和速度。都 MIT 协议。
很多朋友想嫁接到Claude Code中,我说说怎么在 Claude Code 里用上它。
DeepSeek V4 是什么
简单讲,V4 是一个混合推理模型。以前用 DeepSeek 你得纠结选 deepseek-chat (快但不太会推理)还是 deepseek-reasoner (会深度思考但慢)。V4 把这俩合二为一了——模型自己判断问题的复杂度,简单问题秒回,复杂问题自动进入深度思考模式。
两个版本的区别不复杂:
V4-Pro:1.6万亿参数,每次激活 490亿。性能直接对标 GPT-5.4 和 Claude Opus 4.6。在 SWE-bench 编程基准测试上得分 80.6%,几乎跟 Opus 4.6 的 80.8% 打平。适合你真正需要"烧脑"的场景。
V4-Flash:2840亿参数,每次只激活 130亿。轻量、快、便宜。大部分日常任务用 Flash 就够了,响应速度体感上比 Pro 快不少。
两个模型都支持 100万 token 的上下文窗口。
这是什么概念?一本 20万字的案卷材料,扔进去,还有余量。这是 V4 最大的实用升级——之前的 DeepSeek 模型上下文窗口有限,处理长文档得切段,现在直接全扔。
定价方面:V4-Pro 每百万 token 输入 1元或12 元 (取决于是否命中缓存) ,输出 24元;V4-Flash 每百万 token 输入 0.2元或1元,输出 2元。
当前 deepseek-v4-pro 模型限时 2.5 折,优惠期至北京时间 2026/05/05 23:59,真是便宜又大碗。
另外提一句,这次 V4 的训练用的是华为昇腾芯片。DeepSeek 说他们跟华为做了深度适配,1M 上下文的计算效率达到了"世界领先"。
一份难得的实诚
读完 DeepSeek 的官方公告,有一个细节让我印象很深。
他们的用词。讲 V4-Pro 的性能,用的是 "rivaling"——比肩,不是超越。
讲世界知识广度,坦率地说"领先所有开源模型,但落后于 Gemini-3.1-Pro"。讲推理能力,依然是"rivaling top closed-source models"——匹敌,不是击败。
整个公告里,DeepSeek 没有说过一句"我们超越了 Claude"或者"我们打败了 GPT"。在所有同步流出的第三方评测中,V4-Pro 的 SWE-bench 得分是 80.6%,Opus 4.6 是 80.8%——差 0.2 个百分点。DeepSeek 完全可以在公告里找一个对自己有利的基准说自己"超越",但他们没有。
有外媒报道,DeepSeek 内部评估认为自己在整体能力上仍然落后 GPT-5.4 和 Gemini 3.1-Pro 大约"3 到 6 个月"。这个判断他们没有藏着掖着,而是经由技术报告和相关报道公开传递了出来。
DeepSeek 选择很明确:我们把东西做好,开源出来,性能在哪条线上就是哪条线,不吹也不藏。
这种诚实本身就值得尊重。它让开发者能做出真实的评估,而不是被营销话术裹挟。它也让人愿意给这支团队更长的时间,一群知道自己站在哪里、也知道自己要往哪里去的人,比那些天天喊"我们已经超越全人类"的,更值得期待。
DeepSeek 从 V3 到 R1 到 V4,两年不到的时间,用远少于硅谷巨头的预算,先是在推理上打开缺口,现在又在通用能力和上下文长度上追到一线水平。而且每一代都在开源。
这条路不容易,但他们走得扎实。
在 Claude Code 里用上 DeepSeek V4
Claude Code 本身是为 Anthropic 自家的模型设计的。但它可以通过邪修方法使用其他模型。
配置不复杂,跟着我做。
第一步:拿到 DeepSeek 的 API Key
注册完DeepSeek账号之后,打开 platform.deepseek.com/api_keys,注册账号,在"API Keys"页面创建一个 Key,并复制保存(如果不复制保存,又要重新创建)。
然后实名认证一下。
认证成功之后,进行充值,这时候你的API_Key才可用。我这里充值了20元。
第二步:配置CC Switch
Claude Code 默认把请求发给 Anthropic 的服务器。我们要让它改道 DeepSeek。DeepSeek 提供了一个 Anthropic 兼容的 API 端点: https://api.deepseek.com/anthropic 。
因此我们就可以直接使用CC Switch(CC Switch的使用可以参考 法律人学Claude|第二期:半小时装好 VSCode + Claude Code )改变Claude Code的api供应商。
可以在公众号对话框回复 CC Switch ,会直接给你发送安装包。
这里面除了API Key,其他的和我填一样的就行。 完成之后点击保存,并切换为DeepSeek。
第三步:重启Claude Code并使用
设置好后,重启Claude Code。
在Claude Code对话框中选择模型中可以看到:
和他进行对话,确认一下模型有没有配置成功:
如果像我图中一样回复, 我是DeepSeek V4 Pro ,就可以确认你已经配置好了。
然后就可以美美使用 DeepSeek V4 Pro 了。
后续我也会继续测评DeepSeek最新模型在AI agent方面的表现以及使用费率情况,大家可以关注一下。
往期回顾
法律人学Claude|第一期:桌面版已经很好用了,为什么我还是力推 VSCode 插件版?
法律人学Claude|第二期:半小时装好 VSCode + Claude Code
法律人学Claude|第八期:法律人的文档革命——你必须学会Markdown
法律人学Claude|第九期:给自己定制一个审合同Skill——Skill详解
法律人学Claude|第十三期:为你的团队配置初、中、高级法律民工