用Harness揭秘AI辅助审判丨上篇：深圳的大型试验

*本文基于互联网公开信息写作，观察样本存在滞后性，可能与现实情况不符，仅作探讨。

2024年6月28日，深圳中院的发布会上，一位副院长说了这样一句话："未来就在眼前。"

这不是比喻。就在那天，深圳中院正式上线了一套自主研发的AI辅助审判系统。它不是个别法官私下用ChatGPT写判决，不是处理送达和利息计算的事务性工具，而是直接介入"本院认为"这个法官裁判最核心的环节，由AI来生成裁判推理，法官审阅修改，最终签发。

研究者在2025年《法律分析杂志》上把这件事定性为"全球首例"：全世界第一个由法院机构系统性地将大语言模型嵌入裁判推理过程的案例。不是试点，是全院推广的日常操作。

这件事值得认真了解。

深圳为什么是第一个

压力是根本原因，资源是条件，政策是推力。

先说压力。深圳两级法院连续三年收立案体量超70万件，全员长期满负荷运转。基层法官人均年办案量超过400件，大约每个工作日要处理1到2个案件的某个环节，而每个案件从立案到结案少则数月，多则数年。福田区法院一位助理描述过这种状态："当事人提交的诉讼材料中常常存在信息错误，逐字逐句校对的时间成本很高，资料审核也容易疏漏，时间、年份、姓名、数字这些基础信息都可能出问题。"

这不是个别法院的困境。这是中国司法体系长期以来"案多人少"矛盾最集中的一个缩影，而深圳因为经济体量大、纠纷类型复杂，这个矛盾尤其突出。

再说资源。深圳是中国的硅谷，华为、腾讯、DJI都在这里，工程师密度在全国名列前茅。深圳2023年GDP达到3.46万亿元（约合4820亿美元），超过了毗邻的香港（3820亿美元）。这座城市既有动力也有能力做别的城市做不到的事。

最后是政策。2022年12月，ChatGPT刚刚发布，最高院随即印发《关于规范和加强人工智能司法应用的意见》，提出"建立健全司法人工智能技术应用体系，为司法为民、公正司法提供智能支撑"。各地法院自然地把这份意见解读为对生成式AI进入司法的背书。

深圳法院案件压力

深圳中院院长的判断很直接："人案矛盾最突出的是深圳，高科技前沿也在深圳。率先建设提升司法审判质效的人工智能应用，是深圳法院高质量发展的必然之路，也是契合特区法院审判工作现代化的必由之路。"院党组先后召开8次研究部署会，15个业务研发小组和11个基层法院应用小组同步推进，系统建设被纳入"一把手"工程，深圳主要领导也专门作出批示，有关部门对系统研发全力支持。

系统是怎么建成的

合作方是一家国内头部大模型公司。但这不是普通的甲乙方采购关系。

这家公司的研发团队整体搬进了法院大楼，法院专门腾出整层楼供其办公，双方的关系更像联合研发团队。11名法官从审判岗位抽调，全职参与系统研发，角色类似科技公司的产品经理，核心任务是确保模型的功能真正契合法官日常办案的实际需求，他们知道什么环节最耗时，什么错误最常见，什么信息法官最需要在关键时刻看到。

训练数据的体量是这套系统的基础。历时10个月，系统汇聚了从法律法规到条文释义、从人民法院案例库和法答网到法信平台再到历年电子卷宗的多平台数据，总量达到约两万亿汉字量级的法律专业语料，覆盖100多类案由的裁判指南。模型参数规模与GPT-3.5相当（约1750亿参数），上下文窗口类似，但它不是通用模型，它是专门为中国法院场景训练和精调的垂直模型。深圳市委协调提供了专网GPU资源，投入70P FLOPS稀疏算力（相当于5800多张 NVIDIA H100显卡）作为算力支撑。

这和直接调用ChatGPT有本质区别。当时，通用LLM在法律查询场景中的幻觉发生率约58%，它们会自信地引用根本不存在的法条，给出和现行法律完全矛盾的解释。深圳系统为此采用了检索增强生成技术（RAG）：当需要引用法条时，系统先从法律数据库中检索，再基于检索结果组织文字。这从技术层面规避了法条引用幻觉的主要来源。

系统建设规模

2024年6月28日，系统正式上线。从立项到上线，10个月。

系统能做什么：四个模块，全流程覆盖

这套系统的功能被整合进一个平台，覆盖办案的四个关键环节。

四模块全流程

立案智审模块是最早上线的，2024年1月先行投入使用。它辅助法官智能核查35项立案标准，一次性给出结论，极大提升了立案登记效率。截至2024年8月报道时，该模块已辅助立案31万余件，一次性提示当事人补充材料9000余次，这意味着9000次可能的来回补材料被压缩到了一次性告知。

智能阅卷模块做的是信息整理工作。它自动分类整理卷宗，校准涉案数据（时间、年份、姓名、金额），利用文档解构技术将诉讼材料归纳整合成结构化的庭审提纲，智能提取争议焦点，形成当事人画像和案件画像。助理提到的那些逐字核对工作，大部分被这个模块接管了。

智能庭审模块在庭审过程中实时辅助。它根据案件类型和争议焦点，生成法官在庭审中可提问的问题清单，对夫妻债务、共同经营行为等复杂庭审难点给出案件存疑问题，同时推送相关法条、类案裁判和法答网精品解答。深圳中院一位法官在处理一起劳动争议纠纷时，系统一次性推送了法条智推、法答智推、类案智推三类内容，她综合考量后对劳动关系从属性作出了认定。

智能文书生成模块是整套系统的核心，也是最具争议性的部分。在法官对每个争议焦点作出裁决后，系统支持AI基于这些裁决生成完整的说理文字，法官修改后形成最终判决书。覆盖的案件类型几乎涵盖所有民商事类别：家事、财产、合同、侵权、公司、劳动等。

金融法庭一位法官审理一起借款合同纠纷案件时，庭审结束后她点击"文书生成"，几秒钟内，一份裁判文书初稿完成，完成度超过九成。她的评价是："初拟的说理部分很惊艳，'即日裁决'指日可待。"

法官和AI是怎么配合的：一套三步Harness

要理解这套系统的运作逻辑，需要借用一个工程概念。

Anthropic（Claude的开发公司）在研究如何部署长期自主运行的AI系统时，把这类架构称为 Harness，不是单个AI，而是一套把AI行为约束在特定轨道上的结构化协作机制。Harness定义的是：谁做什么，信息怎么流动，人和AI在哪里交接，各个环节的输出如何传递给下一环节。

深圳系统的Harness结构是三步走：

第一步：法官主导输入，Harness的起点。法官根据证据材料和庭审过程确定案件事实。当诉状和答辩状准备充分时，系统可以自动生成事实部分的草稿，但法官通常需要根据自己对证据的判断进行补充和修正。

接着，法官识别案件的争议焦点，并对每个争议焦点作出初步判断：支持还是不支持原告的主张。这是整个流程的起点，也是边界，AI后续做的一切，都建立在法官这个初步判断之上。

第二步：AI生成裁判理由，Generator层。 AI接收法官的裁决方向，通常在一分钟以内生成完整的说理文字：引用相关法条原文，梳理证据的证明力，构建逻辑论证，回应可能的反对意见。

一位法官描述这个过程："有时候它给出的理由会让你感到意外，有种'看到了你没想到的论证角度'的惊喜感，就像看一个学生交了一份比预想更好的作业。"

第三步：法官修改定稿，人工审核层。法官以AI文字为底稿，修改润色，补充案件特有的细节分析，作出最终判决。

系统在每个关键环节设有审核、确认、决定选项，法官需逐一勾选，确保裁判权始终留在人的手里。法官的修改内容会作为反馈保存在系统中，用于持续改善模型表现。

Harness架构：现状vs完整设计

一位深圳法官把自己的实操流程总结成三个阶段：

第一，生成框架，用系统处理程序性内容，归纳双方论点，提取证据文本，不急于生成"本院认为"部分；

第二，事实认定，法官独立分析证据，填入确定事实，自己归纳争议焦点，再触发生成"本院认为"（这是最核心的阶段，"有时候AI提呈的判决理由你没想到，整个交互过程像看AI交作业"）；

第三，修改反馈，修改说理部分，将修改结果保存为反馈数据。

一个真实的判决书案例

研究者记录了一个完整的判例，可以具体看清这个流程是如何运作的。

X公司破产案股权流转时间线

案件是这样的： X公司的破产管理人起诉了X公司的五名股东（个人A、B、C、D，以及公司E），要求他们补缴未实缴的注册资本，用于偿还债权人。

案件事实复杂：2016年X公司由A、B出资设立，注册资本1000万元；2017年A、B将股权分别转让给C、D；2018年C、D以每份1元的价格将股权转让给公司E；就在那前后，E公司的关联公司向X公司转入1000万元，但这笔钱随即被转走，没有用于公司日常经营。

这是一起涉及抽逃出资嫌疑、多方股权转让、关联方资金流转的复杂公司案件。

AI辅助系统首先自动归纳了争议焦点，第一个争议焦点是：

被告公司E是否已向X公司实际缴纳了1000万元注册资本？

法官对这个问题选择了"否"。AI在不到一分钟内生成了以下推理：

关于第一个争议焦点，《中华人民共和国企业破产法》第三十五条规定：人民法院受理破产申请后，债务人的出资人尚未完全履行出资义务的，管理人应当要求该出资人缴纳所认缴的出资，而不受出资期限的限制。

本案中，虽然被告公司E提交了借款合同、授权委托书、转账记录、代付款说明、收据、出资证明等证据，表明公司E通过公司F向X公司转账1000万元，但这些转款并未明确标注为出资款项。而且，转款后X公司迅速将大部分资金转移至公司G或公司H，而非用于公司日常经营或优先偿还破产清算中的职工薪酬债权。此外，公司E在庭审中未能对这1000万元的具体用途和支付原因提供合理解释及相应证据。

考虑到破产清算过程中X公司的股东C和D以低价转让股权但未实际缴纳出资，存在逃避出资义务的嫌疑，且X公司的工商登记信息显示破产申请受理时资本尚未足额缴纳，后续出资信息与实际情况不符，并与管理人无法接管财务账册的事实相矛盾。

依据企业破产法第三十五条，管理人有权要求出资人在破产申请受理后立即缴纳出资，不受原出资期限约束。

因此，在公司E未能有效证明其实际缴纳认缴的1000万元出资的情况下，法院认定被告公司E未向X公司实际缴纳1000万元注册资本。

AI生成裁判推理界面

研究者的评价是：这段推理有效地将案件事实与争议焦点连接起来，引用的法律条文准确无误，没有出现幻觉问题，逻辑链路清晰，对被告证据的反驳涵盖了资金用途、异常流转、关联方关系等多个维度。

这位法官随后把争议焦点表述调整为自己更习惯的措辞，AI再次生成了一版措辞更新的推理，逻辑更完整，还补充了"管理人无法接管财务账册导致无法核实出资"这一关键事实。

最终，法官在AI推理的基础上进一步细化和修改，增加了五条具体分析：转款未标注出资性质、大额资金快速流出至关联公司且特征与虚假出资吻合、被告无法解释资金用途、各方联络管理人失败且疑似逃避配合、出资验证报告在破产申请受理后才出具且时间逻辑存疑。法院最终支持了管理人要求公司E缴纳265万元出资款的诉请。

这个例子让人清楚地看到：AI生成的推理是底稿，法官的修改是在底稿基础上的深化，两者深度融合，难以截然分开。

效率数字

系统上线效率数据仪表盘

系统全面上线36个工作日内的数据：

智能辅助阅卷： 57,052件
辅助庭审： 23,701次
辅助生成裁判文书： 52,554份

2024年7月单月（系统上线首月）：

全市法院民商事案件结案： 3.7万件，同比上升 73.9%
平均结案时间缩短： 38.54天
存案下降： 29.3%

全市法院系统上线后头5个月（2024年7月至11月）共发出约9万件民商事判决，其中相当比例含AI生成内容。

推进办组长把这个变化比喻为"司法生产力的工业革命"，说AI相当于工业革命时期的蒸汽机。

律师的感受同样直接。一位代理案件的律师张律师说："现在不论繁案简案，判决书都完整规范，类案同判，说理部分翔实严谨，当事人有了被重视的感觉，即使败诉，不服情绪也明显缓和了。"

这在全球是第一次

做几个对比更容易理解这件事的分量。

2023年2月，哥伦比亚一名法官在媒体上披露，他在处理一起涉及未成年人权利的案件时，使用ChatGPT撰写了约30%的裁定文字。那是个人的、偶发的、使用通用模型的行为，没有任何机构设计，没有专用训练，法条幻觉的风险完全暴露。

巴西联邦审计法院开发了一套LLM辅助系统，但它仅用于审计员的案件初步审查和报告生成阶段，辅助提取指控内容、评估案件可受理性，不介入法官的裁判推理，也不触碰定罪量刑这类核心决策。

中国此前的智慧法院建设，重心是债务类案件的利息和还款计算、判决书模板的自动填写、程序性工作的流程优化。这些都是"自动化"，而非"智能化"，AI替代的是人的机械劳动，不是人的推理判断。

全球对比：为什么是全球首例

深圳系统跨越了这道边界。它直接生成"本院认为"，这是裁判文书中法官说明自己为什么这样判的部分，是整个裁判行为的智识核心。研究者用来定性这件事的词是"世界首例"（arguably the first instance of this in the world）。

法官怎么看这件事

接受研究者访谈的深圳法官，态度并不一致。

有法官表达了惊讶和依赖。"AI已经具备了'自我意识'，拥有法律推理能力。它能自己建构推理逻辑和思维框架，类似于拥有'人类思维'或'法官思维'。"另一位法官说，他对几乎每一个案件都使用AI来生成推理草稿。

系统的记忆优势被反复提及。一位主要处理复杂公司案件的资深法官说："有些案件事实复杂，我自己写完所有事实后，有时会忽略某些具体细节。但它（AI）从不遗忘。"

法官对AI系统的分化态度

也有法官持保留态度。处理小额贷款和消费者债务追偿类案件的法官对这套系统兴趣不大，这类案件的判决通常不需要大段推理，AI的附加值有限。还有法官认为系统对过于简单或过于复杂的案件都效果不佳，最好用的是中等难度的案件。

管理层的担忧则更深。一位基层法院副院长说："我更担心AI会让'强者更强'。擅长使用AI的法官可能效率越来越高，不擅长的法官效率反而下降。当然，AI使用的实际影响需要长期观察。"

还有一位法官说了一句让人印象深刻的话："AI的使用让我产生了一个新的思考，AI是否会限制法官的思维。当然，法官完全可以不理会AI的建议，但AI的出现可能确实会对法官的思维产生限制。特别是在高认知负担的情况下（深圳法官可能每年要处理300到400件普通案件），系统的建议很可能被法官在没有多少反思的情况下直接采用。这是一个值得我们认真关注的问题。"

这句话说出了一个问题，但没有答案。答案在中篇。

AI赋能的马太效应

参考来源

John Zhuang Liu & Xueyao Li, How do judges use large language models? Evidence from Shenzhen , Journal of Legal Analysis, 2025, Vol.16, pp.235–259. DOI: 10.1093/jla/laae009
庞闻淙、孙凯：《面向未来：数字法院智能化应用路径的再优化——以上海、苏州、深圳的建设模式为样本》，载《法治实践》2024年。
何奎：《在深圳，智赋未来》，人民法院报，2024年8月29日第001版。
Anthropic Engineering: Effective Harnesses for Long-Running Agents ; Harness Design for Long-Running Application Development . anthropic.com/engineering, 2025–2026.

如果你想学适合法律人的AI，我创建了一个知识星球，可以直接咨询我微信： Law-AI 。

加入星球你将获得：

法律案例检索福利（建设中）；

如何理解 AI 产业带来的法律蓝海业务；如何搭建属于自己的提效 AI Agent 和工作流；

法律人如何用 AI 提升检索、写作、分析和办案效率；

如何用 AI 运营自媒体、打造个人 IP、获取更多专业机会。

如果你付费过法律人学Claude｜第十六期：终结Dirty Work——纯自动化干活这篇文章，可以私聊我再额外领取一张一百元优惠券。

往期相关内容回顾

法律人的AI agent教程合集

法律人学Claude｜第一期：桌面版已经很好用了，为什么我还是力推 VSCode 插件版？

法律人学Claude｜第二期：半小时装好 VSCode + Claude Code

法律人学Claude｜第四期：你的项目助理—CLAUDE.md使用指南

法律人学Claude｜第九期：给自己定制一个审合同Skill——Skill详解

法律人学Claude｜第十四期：法律检索报告实战

法律人学Claude｜第二十期：学习AI的顶级心法

我创建了法律人的AI社群，每天大家讨论AI，一起进步成长。

如果想要加群，可以在公众号主页找到我的联系方式和过渡交流群加进来。