以前我们只能在案例检索网站直接检索案例,现在有了AI,我们可以借助AI进行检索。
但前一段时间有个新闻,有个律师拿着用AI检索的案例交给法院,案例说理充分,很像法院的文笔,但法院查了半天,没有查到这个案例。
最后真相大白,AI自己编造的案例。
其实这不是AI第一次出现幻觉了,经常使用AI的人都知道,2023年AI刚出来时幻觉超强。
虽然现在幻觉少了,但是很隐蔽,AI虽然检索了案例,但是还要自己核查一下,如果发现是假案例,还要重新修改,非常浪费时间。
有没有一种办法,让AI找到可信源,只从可信源拿案例做案件分析呢?
这本质上就涉及到了上一期 法律人学Claude|第十一期:给AI这匹野马套上缰绳——Hooks机制 提到的Harness Engineering工程。
我理想的解决方案是:用 MongoDB 给你做一套数据库,供AI检索使用。
本期以裁判文书数据库为例,让 Claude 帮你完成安装、入库、精准检索。
一、数据库 vs Excel vs 文件夹,差在哪里
如果说裁判文书是一摞案卷。
文件夹的做法是按案由分格归档——合同纠纷放一格,掩饰隐瞒放另一格。每次查案,打开格子,一份一份翻。文书本身是全文,没有索引。要回归案例检索网站检索。
数据库的做法是给每份文书建一张索引卡,上面提炼出案号、法院、案由、判决结果、关键情节。AI查案不需要查案例检索网站(前提是你有本地库),只扫索引卡——条件一组合,秒出结果。
这个思路在 AI 时代很重要,不只适用于案例库。
但要现在就开始积累了。
二、选哪种数据库?
很多人第一次听说数据库会问:Excel 不也有表格吗,为什么要用数据库?
区别在规模。Excel 管几十条没问题,上千条之后多条件筛选就开始卡,而且没办法写查询逻辑。数据库是专门为大量数据的快速检索设计的,这是它的本职工作。
数据库分两大类:SQL 数据库(比如 MySQL)和 MongoDB。两者的核心区别只有一个:SQL 要求所有记录用同一套字段,MongoDB 允许每条记录字段各不相同。
这对法律文书来说很实际。刑事判决书有"被告人""罪名""量刑情节",民事判决书有"原告""标的额""违约金",行政判决书有"被申请人""行政行为"——每类案件字段差异很大。用 SQL 的话,你要提前把所有可能用到的字段都列出来,刑事案件里"标的额"这一列永远是空的,民事案件里"量刑情节"也是空的,很别扭。
MongoDB 不强迫统一字段。刑事案件存刑事案件的字段,民事案件存民事案件的字段,互不干扰。每条记录用 JSON 格式存储,就像一张填好的表单,字段叫什么、有多少个,随时可以调整。
还有一个实际原因选 MongoDB:它的 MCP 插件成熟,Claude 操作起来顺,不会莫名其妙出错。
三、从案例检索网站下载案例表格
很多律师用案例检索网站检索裁判文书。
这类平台有一个实用功能—— 批量导出检索结果 。
在检索结果页勾选你想要的案例,点"导出",选 Excel 格式,就能下载一份包含核心字段的表格文件。里面通常有案号、案例名称、审理法院、省份、审判日期、案件类型、案由、审判程序、文书类型、当事人、代理律所、裁判理由、裁判结果、审理人员这些列,基本够用。
我手里有一份这样的文件,100条掩饰隐瞒犯罪所得的一审判决,字段整齐。第一条记录大概是这样:
案号:(2024)湘1129刑初9号
审理法院:湖南省江华瑶族自治县人民法院
审判日期:2024-03-25
被告人:石某,辩护律所:湖南瑶洲律师事务所,辩护律师:赵辉、罗晓璇
裁判结果:有期徒刑二年八个月,并处罚金二万元
主要情节:从犯、自首、认罪认罚、退缴违法所得
这份表格就是建案例库的原材料。接下来让 Claude 帮你把它导进 MongoDB。
四、让 Claude 帮你完成安装
不用自己研究安装文档。打开 VSCode,在 Claude 对话框里说:
帮我在本机直接安装 MongoDB数据库,作为我的案例检索数据库。
Claude 会告诉你打开终端、输入安装命令完成安装完并验证。整个过程由Claude自己操作就行,遇到报错 Claude会自己解决。
MongoDB 装好之后,还需要配置 MongoDB MCP 服务,让 Claude 能直接操作数据库。告诉 Claude:
帮我在 Claude
Code
里配置 MongoDB MCP 服务,数据库在本机,端口用默认的。
Claude 会找到 MCP 配置文件,写入正确的连接信息。重启 VSCode 后,Claude 就和本地数据库打通了。
五、把表格里的案例导入数据库
安装好之后,告诉 Claude:
我有一份从案例检索网站导出的案例表格,路径是 /案件材料/case_data.xls,帮我读取这份文件,把每一行导入 MongoDB,数据库名用 law_cases,集合名用 cases。字段名用表格第一行的列名,遇到空字段可以跳过。
Claude 会直接完成读取、清洗、写入。100条案例几分钟入库。
入库完成后,让 Claude 做一次验收:
查一下入库集合现在有多少条记录,随机取3条给我看看,确认字段格式正常。
你也可以让Claude安装MongoDB Compass,可以直接看到一个可视化的界面。
六、让 Claude 记住数据库,每次自动去查
数据库建好了,但每次新开对话,Claude 并不知道你有这个案例库。要让它记住,有几个办法,按难度递增。
最简单的是在 CLAUDE.md 里写一段说明。打开案件工作区的 CLAUDE.md,加上这几行:
## 案例数据库
本机运行 MongoDB,连接地址 localhost:27017,数据库名 law_cases,集合名 cases。
收录案例:掩饰、隐瞒犯罪所得裁判文书 100 余份。
字段包括案号、审理法院、省份、审判日期、案由、被告人、辩护律所、裁判结果、量刑情节等。
检索案例时,优先通过 MongoDB MCP 查询此数据库,不要凭记忆回答。
每次打开这个工作区,Claude 会自动读到这段说明,知道去哪里查。
如果你希望说到"量刑参考""找案例"这类词时 Claude 自动查库,可以配置一个 Hook。告诉 Claude:
帮我配置一个
Hook
,当对话里出现
'案例库''检索案例''量刑参考'
等词时,自动在对话背景里注入
MongoDB
数据库的连接信息和使用说明。
Claude 会帮你生成配置并写入正确位置。配置完之后,你说"帮我找一下从犯加自首的案例",Claude 不需要你再解释数据库在哪,直接去查。
还可以更进一步,把"查案例库"封装成一个 Skill。告诉 Claude:
帮我创建一个叫
case
-
search
的 Skill,功能是查询本地 MongoDB 案例库,支持按罪名、法院、量刑情节、审判程序等条件组合检索,结果按审判日期排序。
Claude 会帮你写好 Skill 文件,保存到对应目录。以后输入 /case-search ,Claude 直接进入案例检索模式,不需要每次重新交代背景。
以后就可以多多积累案例,让Claude愉快地使用数据库进行案例检索了。
常见问题
Q:MongoDB 要花钱吗? A: 社区版完全免费。商业云端版收费,本机使用不需要。
Q:数据存本地,安全吗? A: 数据库装在你自己的电脑上,Claude 通过 MCP 操作的是本地数据库,不经过任何云端服务器。
Q:导入时报错怎么办? A: 把错误信息粘给 Claude,说"帮我解决这个导入报错"。MongoDB 的常见错误就那几类,基本都能直接解决。
Q:案例库以后想继续扩充怎么办? A: 随时加。下次再导出一批新案例,让 Claude 导入时跳过重复案号,新案例追加进去,已有数据不受影响。
往期回顾
法律人学Claude|第一期:桌面版已经很好用了,为什么我还是力推 VSCode 插件版?
法律人学Claude|第二期:半小时装好 VSCode + Claude Code
法律人学Claude|第三期:让Claude更高效读懂你的文件
法律人学Claude|第四期:你的项目助理—CLAUDE.md使用指南
法律人学Claude|第五期:让Claude用上次抛App——Skills初解
法律人学Claude|第六期:不做8秒记忆的金鱼——优化记忆Memory
法律人学Claude|第七期:给Claude装上"外挂"——CLI与MCP工具使用指南
法律人学Claude|第八期:法律人的文档革命——你必须学会Markdown
法律人学Claude|第九期:给自己定制一个审合同Skill——Skill详解
法律人学Claude|第十期:被AI改乱的文档如何自救?——Git工具的使用
法律人学Claude|第十一期:给AI这匹野马套上缰绳——Hooks机制
对了,我建了一个交流群,有想 进群 的伙伴可以 加我 。