就这么在Claude Code里配置DeepSeek最新模型

4月24号，DeepSeek V4 终于发了。

说"终于"不是夸张。从去年底 V3 发布算起，这一年多里，"V4 什么时候出"大概是 AI 圈被问得最多的问题之一。春节说发，没发。三月说要发，又拖了。四月中旬上线了"专家模式"做灰度测试，大家都觉得快了快了——然后 4月24号，正式来了。千呼万唤始出来。

但这次 V4 并没有犹抱琵琶半遮面。一出手就是两个模型同时开源，权重直接扔上 Hugging Face，API 即刻可用，技术报告全文公开，性能数据不加滤镜——Pro 比肩顶级闭源，Flash 主打速度和成本。不玩虚的。

它不是 V3 的小版本迭代，是一个全新的代际升级。两个模型：V4-Pro 打性能天花板，V4-Flash 打性价比和速度。都 MIT 协议。

很多朋友想嫁接到Claude Code中，我说说怎么在 Claude Code 里用上它。

DeepSeek V4 是什么

简单讲，V4 是一个混合推理模型。以前用 DeepSeek 你得纠结选 deepseek-chat （快但不太会推理）还是 deepseek-reasoner （会深度思考但慢）。V4 把这俩合二为一了——模型自己判断问题的复杂度，简单问题秒回，复杂问题自动进入深度思考模式。

两个版本的区别不复杂：

V4-Pro：1.6万亿参数，每次激活 490亿。性能直接对标 GPT-5.4 和 Claude Opus 4.6。在 SWE-bench 编程基准测试上得分 80.6%，几乎跟 Opus 4.6 的 80.8% 打平。适合你真正需要"烧脑"的场景。

V4-Flash：2840亿参数，每次只激活 130亿。轻量、快、便宜。大部分日常任务用 Flash 就够了，响应速度体感上比 Pro 快不少。

两个模型都支持 100万 token 的上下文窗口。

这是什么概念？一本 20万字的案卷材料，扔进去，还有余量。这是 V4 最大的实用升级——之前的 DeepSeek 模型上下文窗口有限，处理长文档得切段，现在直接全扔。

定价方面：V4-Pro 每百万 token 输入 1元或12 元（取决于是否命中缓存），输出 24元；V4-Flash 每百万 token 输入 0.2元或1元，输出 2元。

当前 deepseek-v4-pro 模型限时 2.5 折，优惠期至北京时间 2026/05/05 23:59，真是便宜又大碗。

另外提一句，这次 V4 的训练用的是华为昇腾芯片。DeepSeek 说他们跟华为做了深度适配，1M 上下文的计算效率达到了"世界领先"。

一份难得的实诚

读完 DeepSeek 的官方公告，有一个细节让我印象很深。

他们的用词。讲 V4-Pro 的性能，用的是 "rivaling"——比肩，不是超越。

讲世界知识广度，坦率地说"领先所有开源模型，但落后于 Gemini-3.1-Pro"。讲推理能力，依然是"rivaling top closed-source models"——匹敌，不是击败。

整个公告里，DeepSeek 没有说过一句"我们超越了 Claude"或者"我们打败了 GPT"。在所有同步流出的第三方评测中，V4-Pro 的 SWE-bench 得分是 80.6%，Opus 4.6 是 80.8%——差 0.2 个百分点。DeepSeek 完全可以在公告里找一个对自己有利的基准说自己"超越"，但他们没有。

有外媒报道，DeepSeek 内部评估认为自己在整体能力上仍然落后 GPT-5.4 和 Gemini 3.1-Pro 大约"3 到 6 个月"。这个判断他们没有藏着掖着，而是经由技术报告和相关报道公开传递了出来。

DeepSeek 选择很明确：我们把东西做好，开源出来，性能在哪条线上就是哪条线，不吹也不藏。

这种诚实本身就值得尊重。它让开发者能做出真实的评估，而不是被营销话术裹挟。它也让人愿意给这支团队更长的时间，一群知道自己站在哪里、也知道自己要往哪里去的人，比那些天天喊"我们已经超越全人类"的，更值得期待。

DeepSeek 从 V3 到 R1 到 V4，两年不到的时间，用远少于硅谷巨头的预算，先是在推理上打开缺口，现在又在通用能力和上下文长度上追到一线水平。而且每一代都在开源。

这条路不容易，但他们走得扎实。

在 Claude Code 里用上 DeepSeek V4

Claude Code 本身是为 Anthropic 自家的模型设计的。但它可以通过邪修方法使用其他模型。

配置不复杂，跟着我做。

第一步：拿到 DeepSeek 的 API Key

注册完DeepSeek账号之后，打开 platform.deepseek.com/api_keys，注册账号，在"API Keys"页面创建一个 Key，并复制保存（如果不复制保存，又要重新创建）。

然后实名认证一下。

认证成功之后，进行充值，这时候你的API_Key才可用。我这里充值了20元。

第二步：配置CC Switch

Claude Code 默认把请求发给 Anthropic 的服务器。我们要让它改道 DeepSeek。DeepSeek 提供了一个 Anthropic 兼容的 API 端点： https://api.deepseek.com/anthropic 。

因此我们就可以直接使用CC Switch（CC Switch的使用可以参考法律人学Claude｜第二期：半小时装好 VSCode + Claude Code ）改变Claude Code的api供应商。

可以在公众号对话框回复 CC Switch ，会直接给你发送安装包。

这里面除了API Key，其他的和我填一样的就行。完成之后点击保存，并切换为DeepSeek。

第三步：重启Claude Code并使用

设置好后，重启Claude Code。

在Claude Code对话框中选择模型中可以看到：

和他进行对话，确认一下模型有没有配置成功：

如果像我图中一样回复，我是DeepSeek V4 Pro ，就可以确认你已经配置好了。

然后就可以美美使用 DeepSeek V4 Pro 了。

后续我也会继续测评DeepSeek最新模型在AI agent方面的表现以及使用费率情况，大家可以关注一下。

往期回顾

法律人的AI agent教程合集

法律人学Claude｜第一期：桌面版已经很好用了，为什么我还是力推 VSCode 插件版？

法律人学Claude｜第二期：半小时装好 VSCode + Claude Code

法律人学Claude｜第八期：法律人的文档革命——你必须学会Markdown

法律人学Claude｜第九期：给自己定制一个审合同Skill——Skill详解

法律人学Claude｜第十三期：为你的团队配置初、中、高级法律民工

法律人学Claude｜第十四期：法律检索报告实战

法律人学Claude｜第十六期：终结Dirty Work——纯自动化干活

法律人学Claude｜第二十期：学习AI的顶级心法