两人律所，如何用AI来对抗千人大所

发表于 2026-03-02 更新于 2026-04-12 分类于 AI

译者按

给大家推荐这篇文章的一个场景发生在晚上七点：一笔收购交易准备第二天收盘，买方律师突然发来一封信，要求重新谈几个核心条款：新的托管条件、扩大的赔偿豁免、修改后的交割文件。潜台词明确：要么接受，要么放弃。作者 Zack Shapiro 把购买协议、披露附表和这封威胁信一起上传给了 Claude AI。几分钟内，Claude 找出了买方律师自己没注意到的漏洞：他们提出的两个豁免条款，和他们此前在披露附表里已确认的内容直接矛盾。对手的强硬姿态建立在一个没做完功课的起点上。到晚上十一点，Zack 有了一套完整的反提案，每一条都精确锚定在买方自己的合同语言上。交易第二天如期完成。

传统上，这个分析需要三个律所合伙人工作到天亮，而Zack的律所只有两人…

这篇文章的核心，是一个关于为什么通用 AI 比任何垂直行业 AI 产品都更强的深度实战记录，远比”法律 AI 很好用”这类软文有料得多。

Zack 在文章里专门讨论了他为什么不用 Harvey、Spellbook 这些法律专属 AI 工具，转而直接使用 Claude这样的通用性AI。他的逻辑，和《当 Coding 被解决之后》里提到的 Bitter Lesson 完全吻合。Rich Sutton 的苦涩教训说的是：AI 研究 70 年最大的收获，是通用计算方法最终总是击败人类精心手工设计的方法。垂直法律 AI 的逻辑是”在通用模型外包一层法律知识”，但问题在于，真正值钱的从来不是模板库（每家律所的 NDA 长得都差不多），而是律师个人积累十年的判断力：知道哪场谈判值得死磕、哪个条款可以让步，在对手强硬时能看穿他们没做完的功课。

这种判断力无法被机构模版化。但可以被个人编码进 Claude 的 Skills 系统，而这恰恰是 Claude 的通用能力给出的解法，任何垂直包装产品都无法复制。

另一个让我印象深刻的细节：Zack 有一种让他难以阅读长文档的疾病，于是他用 Claude的编码模式自己写了一个命令行工具，把法律文件转成语音，在通勤路上听合同。这种驾驭程度不是随机分布的。我在《AI 时代，平庸者很危险》里写过一个概念：阈值之上的人，AI 给他的不是两倍效能，是十倍。Zack 就是这个概念的活案例。

最后，文章里有一句话我直接共鸣到了：

“我的两人律所，处理的是大型律所的工作量，直接与数百人规模的律所竞争，且成本结构更具优势。”

因为我当前的项目也是这么小型化团队+强AI辅助来运作的，所以更能深刻感触到：这不只是律所的故事，而是正在发生中各个行业中的一个缩影，值得所有白领工作者看看。

全文速览

选通用不选垂直：Harvey 等法律垂直AI产品本质是在通用模型外包一层法律知识，但律师真正的竞争壁垒从来不是模版库，而是个人判断力，哪场谈判值得死磕、在对手强硬时能看穿他们没做完的功课。这种判断力无法被Harvey模版化，但能被个人编码进 Skills 指令文件供自己使用；
代码能力是降维打击：Claude 能直接操作 Word 文件，生成带编辑标记的 .docx，对手律师可以直接在 Word 里正常打开审阅。传统法律 AI只能告诉你合同哪里有问题，但Claude 还能直接改好、格式化、生成对照修订稿，全程甚至不需要打开 Word；
Skills = 编码个人判断力：不是每次重新输入提示词，而是把”十年积累的分析框架”写成一次性指令文件，之后自动触发。六个 Skill 打包成 plugin，可以装到他的助理的机器上，第一稿就按合伙人标准输出；
防幻觉靠审查层：研究 Skill 要求 Claude 在输出前自我校验，核实每条引用真实存在，标记低置信度结论。那些因 AI 虚假引用被制裁的律师，问题不在 AI，在于没有这层质检；
定价模式跟着变：成本结构变了，可以给客户提供月订阅而非按小时计费，客户不怕打电话，收入从大起大落变得可预测；
判断力是 AI 时代的稀缺资产：有 10-20 年积累的专业人士，手里的东西在 AI 时代变得更值钱，而不是更没用。AI 不在执业，你在执业，AI 只是放大你的判断力。多数人还没意识到这一点。

以下为原文全文翻译，作者 Zack Shapiro - The Claude-Native Law Firm

2026 年，我如何真正用 AI 执业

几个月前，一位客户的收购交易准备次日收盘，买方律师在晚上七点发来一封信，要求对几个核心交易条款进行重新谈判：新的托管条件、扩大的赔偿豁免范围、修改后的交割文件清单。言下之意很清楚：接受这些修改，或者我们撤了。

我把购买协议、披露附表和这封要求函一起上传给了 Claude。几分钟内，Claude 把买方提出的每项修改都与现有交易条款逐一比对，发现了买方律师自己显然没注意到的问题：他们提出的两个豁免条款，与他们在披露附表中已确认的内容直接矛盾；第三个条款则与基础陈述条款（fundamental reps section）产生了内部冲突，实际上削弱了买方自己的交割后保护。他们咄咄逼人的最后一刻攻势，本身就有漏洞。

当晚谈判通过邮件来回持续进行，我把每一封新邮件都输入给 Claude。它追踪每个提议的让步如何与协议各条款交互，标出接受某处修改会在其他条款引发风险的地方，帮我构建了一套回应：该让的让，该守的守。到晚上十一点，我有了一套完整的反提案，每一条都有具体的交叉引用，锚定在买方自己的合同语言上。交易第二天上午如期完成，客户满意。

传统上，一个中型律所的三人合伙人团队需要工作到天亮才能完成这份分析。我在两小时以内拿到了核心内容。

我经营的是一个两人精品律所，专注于初创公司设立、风险投资交易和合规事务。我们的对手是拥有数百人、有时数千人的大所。从道理上讲，我们不应该能做到这些。但过去这一年让一件事变得清晰：一家围绕 AI 构建的小型律所，不只是能跟上大型竞争对手，它运转更快、工作产品更扎实、成本结构更具优势，而这在 18 个月前根本不可能。

支撑我执业的工具是 Anthropic 出品的 Claude。这篇文章解释的是我如何真正使用它，不是理论，是工作流。

为什么选 Claude，而非”法律 AI”

市面上有很多专属法律 AI 产品：Harvey、Spellbook、CoCounsel、Luminance。它们共用同一个论点：律师需要专门为法律工作打造的 AI。我几乎都评估过。对一个小律所从业者来说，一个配置得当的通用 AI 更好用，而且差距不小。

这些专属产品是在驱动通用工具的同一批基础模型上加了一层包装。它们的营销听起来很有说服力：我们根据你律所的执业手册定制 AI，用你的模版训练它，围绕你的简报库或条款库构建工作流。其中一些做得还不错。但这个营销逻辑里有一个根本性的误解，价值究竟在哪里？

模版库不是竞争优势。你所在执业领域里，每家有能力的律所用的模版大差不差：NDA、股权购买协议、劳动合同。这些是商品化的输入材料。区分优秀律师和平庸律师的，从来不是模版，而是律师对模版的处理：如何发现对方在第 14(c) 条里埋下的问题，如何判断哪场赔偿纠纷值得打、哪场可以让步，如何组织建议邮件让客户真正理解风险。这是判断力。判断力不住在机构层面，它住在个体专业人士那里。

当法律 AI 公司谈论”按照律所执业手册定制 AI”时，他们在解决一个几乎不重要的问题，同时忽视了真正重要的那个。真正的杠杆点不在于 AI 从哪个模版出发，而在于告诉它如何思考这项工作的指令：看什么、标记什么、如何权衡竞争考量、用什么格式输出、对客户用什么语气。这些指令编码的是个体律师的判断力，不是律所的模版库。这恰恰是 Claude 的 Skills 系统的设计初衷。

我创建了自定义技能文件，叫做”Skills”，编入了我的分析框架、我偏好的格式、我的声音、以及我对特定类型法律工作应该如何处理的判断。当我上传一份合同让它审查，Claude 用的不是通用框架，不是律所框架，而是我的框架，我在十年执业中积累的那个，而且是自动的。律所执业手册和个体律师编码的判断力之间的差别，就像把食谱给一个人和教会他如何做饭的差别。

还有一个更根本的问题，对花了整个职业生涯在 Microsoft Word 里工作的人来说最重要：Claude 是一个被大量优化用于编写代码的前沿 AI 模型。这听起来和法律执业毫无关系，直到你意识到这意味着什么——Claude 可以即时编写代码，直接操控律师每天使用的应用程序。

想想这具体意味着什么。每位读这篇文章的律师都在 Word 格式问题上浪费过大量时间：从另一份文档粘贴后段落编号乱掉、样式不配合、修订记录跨版本损坏、交叉引用过时、Bluebook 引用格式需要逐个句号逗号手动处理。这些不是法律问题，是软件问题。Claude 用写软件的方式解决软件问题。当我让 Claude 对一份合同应用修订记录，它不用插件，不用宏，而是在 XML 层面打开 .docx 文件，写出 Microsoft Word 所需的精确标记，以我的名字标注，保留每个格式细节。当我让它统一一份诉状里的引用格式，它会写代码在几秒内解析并重新格式化每一条引用。结果和专家手工操作无法区分，用时只是零头。

这是没有任何专属法律 AI 产品能匹配的能力差距。它们给你一个能聊文件的聊天机器人，Claude 是一个能进入文件内部并修改它的系统。这是”能告诉你合同哪里有问题的助理”和”还能帮你修好、格式化、生成对照修订稿、起草附函，全程不需要你打开任何应用”的区别。

通用 AI 的进步速度比任何垂直产品都快。当你用的是前沿模型，每项新能力第一天就发布给你。当你用的是包装层，你在等别人的工程团队决定下一步造什么。

我描述的是我自己的交易律师执业，但架构本身不是专业特定的。诉讼律师会为庭审准备、动议起草、案例法综合、证据开示审查建立 Skills。税务律师会为实体架构、意见函框架、法规监控建立 Skills。家庭律师会为资产追踪和监护权分析建立 Skills。方法是一样的：拿一个强大的通用模型，教它你的执业方式，让它放大你的判断力。内容属于你。

三种模式

Claude 桌面应用有三种模式。学会在什么时候用哪个，是让这一切运转起来最重要的一步。

Chat 是对话界面。我和 Claude 说话的方式，就像和一个坐在对面的博学助理说话。这是我分析法律问题、头脑风暴谈判策略、对一个合同条款做初步判断、或从零起草某份文件的地方。每一步我都在掌控中。大多数用过 ChatGPT 或类似工具的律师，接触的只有这种模式。

Cowork 是自主模式，也是改变一切的那个。我把 Claude 指向电脑上的一个文件夹，给它一个任务，它就去执行：读文件、创建新文件、编辑已有文档、自主决定如何从 A 到 B。当我面对一份需要完整对照修订的 40 页协议，或一摞需要从交易摘要生成的交割文件，我把它们交给 Cowork，让它去干。这是大多数律师还没尝试过的模式，也是最会改变他们执业方式的那个。

Code 是开发模式，拥有完整的终端访问权限。大多数律师不需要每天用它。但我有一种让我难以阅读长文档的疾病，所以我用 Code 模式构建了一个命令行工具，把法律文件转换成语音，处理整个流程：解析 Word 文档和 PDF、把”第 4.2(b)(iii) 条”这样的法律格式转换成自然语音、展开缩写、切分文本、调用 AI 语音 API、合成最终音频文件。现在我在通勤路上听合同。整套工具是 Claude 写的。

教 Claude 你的执业方式

这里的杠杆程度，是两年前的我不会相信的。

Anthropic 发布了一份关于为 Claude 构建自定义 Skills 的指南：结构化的指令文件，教它在特定情境下如何行动。不是每次都要重新输入的提示词，而是当情境合适时自动触发的持久化指令集。我没有从头到尾读这份指南，而是把它上传给 Claude，问了一个更好的问题：基于我们几个月来在合同起草、客户邮件、文档编辑、法律研究、政策写作各方面的数百次对话，哪些 Skills 对我的执业影响最大？

Claude 分析了我们的工作记录，识别出规律：我重复最多的任务是什么、摩擦最高的地方在哪里、结构化自动化能节省最多时间的环节在哪里。它推荐的 Skills 不是通用的，而是针对我实际工作方式的。不是”更快起草合同”，而是”一个有四种不同情境模式的合同审查 Skill，带有严重程度分级、缺失条款检查清单、市场惯例对标，以及在准备标注文档时无缝交接给 Track Changes 编辑 Skill 的机制”。

我们花了几个小时完善细节，在默认设置不符合我习惯的地方提出调整。最后，我有了六个生产就绪的 Skills，打包成一个 Cowork 桌面应用的 plugin：合同审查、Track Changes 编辑、合同起草、客户沟通、法律研究、政策写作。每一个都编码了我在这类工作上多年积累的专业判断。

这对律所管理有一个重要启示：这个 plugin 是可以复制的。如果我有 50 个助理，我可以把它装在每台机器上。每个助理立刻就能按照我的分析框架写合同审查，用我的语气起草客户沟通，按照我偏好的格式应用 Track Changes。原本需要多年带教才能传递的知识，现在是一份从第一稿就能生效的指令文件。产出仍然需要律师审查，但审查的起点已经高了很多。

实际案例

三个真实工作中的例子，因为我希望这是具体的。

不打开 Word，完成 Track Changes。 对方发回一份有修改标注的协议，40 页，涉及陈述、赔偿、知识产权和交割条件的大量修改。我把文档上传给 Claude，说：”从我客户的角度评估对方的修改。”我的合同审查 Skill 启动：Claude 按严重程度整理每项修改，标记对方如何转移风险，识别修改条款之间的张力，检查应该存在但缺失的标准条款，并生成一份摘要，对每个高优先级问题提供具体的反提案语言。

然后我做出判断。Claude 标记了一个修改模式，我凭经验知道这个模式通常意味着什么。Claude 为一个有争议的条款生成了三个备选表述，我选择考虑了关系背景和交易语境的那个，这些是任何 AI 都接触不到的信息。做出决定后，我告诉 Claude 应用这些修改。这是第一次见到的人会瞪眼的部分：Claude 在 XML 层面打开 Word 文档，以我的名义应用 Track Changes，保留每个格式细节，生成一份干净的 .docx，对方律师可以在 Microsoft Word 里正常打开和审阅。我没有打开 Word，没有打开 Litera。Claude 生成对照修订稿，我逐条审查，然后发出去。接着客户沟通 Skill 用恰当的语气起草了附函。从收到对方标注到有一套回应文件准备发出，全程不到一小时，其中大约 30 分钟是我自己的思考。

研究，不产生幻觉。 一位客户需要了解一款新产品的监管环境，问题横跨多个机构和重叠的法律框架。我的研究 Skill 指示 Claude 同时在所有相关维度并行展开研究，而不是按顺序逐一处理：证券分析、州级许可要求、银行监管、消费者保护影响，每个子议题进行多次搜索、交叉引用来源，优先使用一手法律资源（法规、条例、机构指导意见、判例法）而非二手评论。

在向我输出任何内容之前，Skill 要求 Claude 做一轮自我审查。这一步很关键，也是大多数人跳过的。Claude 必须核实每条引用是否真的支持备忘录中的论断，必须标记任何置信度低于”高”的内容，必须检查各节之间是否有内部矛盾，并且必须专门防范幻觉引用——这个问题让几位律师被制裁，还上了全国新闻。那些提交了 AI 生成虚假引用的律师，问题从来不是 AI 本身，而是没有质检层的 AI。

输出是一份结构化的研究备忘录，先出结论、带具体法规引用、有实操建议，一个初级律师要花几天才能做完。Claude 在不到一小时内完成初稿。然后我核实每条引用，压力测试分析逻辑，在我的判断和输出有出入的地方修改。总时间仍然是从头开始所需时间的一小部分。因为 Skill 是按照我的标准校准的（有明确置信度标注的确定性结论、监管框架比较用表格、实操建议而非学术式铺陈），备忘录拿到手就能直接用。

实时合同解读。 一位客户上午打电话说，刚收到对方主张违约的律师函，威胁终止一份商业服务协议，给了 48 小时回应。我上传了协议、律师函，以及客户与对方三个月的往来邮件。Claude 把律师函中的每项事实指控都与被引用的具体合同条款比对，发现：四项主张中有两项引用的义务，已经被对方律师自己起草的补充协议明确修改过了。这封律师函看起来是在没有核对自己修正案的情况下写出来的。

我在起草回应过程中，把每个草稿段落输入给 Claude，压力测试每个论点是否有意外的关联影响。它发现了一个：我计划在服务等级指标问题上提出的抗辩，可能被解读为在第 7 节的付款纠纷问题上做了让步。我重写了这部分。这种在积极起草过程中实时的、逐条款的压力测试，过去需要第二个律师在旁边同步审阅你的工作。现在它发生在同一个对话里，工作也在同一个对话里完成。

权限问题

每个律师都会问。简短的答案：允许你使用云存储、电子取证平台和在线法律研究数据库的同一套框架，在这里同样适用。律师协会指导意见将 AI 工具视为代理人例外原则所覆盖的第三方技术服务商。你的义务是采取合理措施保护客户数据，在实践中意味着：关闭模型对你输入内容的训练、了解服务商的数据处理方式、记录你的推理过程。Anthropic 提供零数据留存 API 选项，确保客户数据不用于训练模型，输入内容在会话结束后不留存。与你当初把客户文件放进 Dropbox 或 Google Drive 之前做的尽职调查是同一类。

我让 Claude 帮我起草了一份 AI 使用条款，加入了客户委托协议。条款把 AI 定位为效率和质量的增强工具，强调律师监督，将数据处理与现有保密义务挂钩，并取得客户同意。客户签了，眼睛都不眨。大多数人原本就假设我在用 AI。他们是对的。

法规现在在大多数司法管辖区要求技术能力。我们正在接近这样一个临界点：不使用这些工具，才是更难在职业责任上站住脚的立场。

提示词即技能

大多数尝试 AI 的律师，输入的是”帮我审一下这份合同”，得到的是平庸的结果，然后就认定 AI 对法律工作没用。

问题不在 AI，在输入。

比较一下”帮我审一下这份合同”和下面这个版本：”从卖方角度审查这份服务协议。标记买方将风险转移超出此类交易市场惯例的条款。检查缺失的标准条款，包括责任限制、知识产权归属、数据处理、便利性终止。按严重程度分级生成摘要，对每个高严重程度问题提供具体的反提案语言。注意卖方谈判空间有限、希望推进成交，因此建议应聚焦在值得争取的条款和可以优雅让步的条款之间的取舍。”

第二个版本第一遍就能产出有用的工作产品。第一个版本产出的如果有用的话也需要大量修改。”AI 是玩具”和”AI 改变了我的执业”之间的全部差距，就在指令质量上。这也是 Skills 重要的原因：它把这个层级的细节编码进去，你只需要写一次，之后每次自动触发。

这改变了什么

由此引出几个值得点名的事情。

人员配置 - 我的两人律所处理的工作量相当于一家大得多的事务所，这直接来自 AI。那些传统上能支撑雇用助理的工作，包括文档初审、研究备忘录、初稿、对照修订摘要、日常往来函，现在由 Claude 在我的监督下处理。说清楚一点：每份离开我律所的文件都由持牌律师审查、修改和批准。AI 做初稿，我做最终工作产品。助理没有过时，但雇用助理在经济上合算的门槛移了。你需要他们做的事也变了：判断力、客户关系、以及 AI 输出的监督，而不是 2000 小时的文件生产。

定价 - 有些任务，节省的时间很明显，我把这些反映在客户收费上。有些任务，同样的工作时间能产出更深入的分析、更全面的问题发现、更高质量的起草，而这在以前不可能做到。重点不是每个任务都花更少时间，而是每个律师工时产出更多价值。我的律所同时提供月订阅定价和传统按小时计费，取决于委托性质。订阅客户按月固定费用获得持续的法律顾问、合同审查、合规监控和日常公司治理。没有计费表在跑。AI 让这个模式成为可能，因为我可以在可预测的费用结构内提供更全面的服务。客户喜欢这个：他们不怕打电话或发邮件。而收入是可预测的，不再大起大落。

判断力 - 我描述的一切都有一个诱惑：让 AI 做太多，停止核查。相关研究的结论一致：在 AI 能力边界之外使用它，或者不审问输出就信任它的人，表现比完全不用 AI 的人更差。会在这项技术上胜出的律师，从根本上理解一件事：AI 不在执业，你在执业。AI 让你更快、更扎实、更稳定。但判断力，那个你决定什么值得争取、什么可以让步的部分，在字里行间读出言外之意的部分，在两可之间做出判断并把声誉押在上面的部分，属于你。有经验的律师在这个新世界里有巨大优势，而大多数人还没意识到这一点。如果你在自己的执业领域花了 10 年或 20 年积累判断力，你手里握的恰恰是 AI 让它变得更有价值的资产。

去建造

我不在 Anthropic 工作。我是一个执业律师，评估了所有可用的 AI 工具，然后把执业构建在了最适合我实际工作方式的那个上面。

大多数律师使用 AI 的方式（向聊天机器人输入一个问题，然后祈祷）与我在这里描述的之间，差距巨大。弥合这个差距不需要技术能力，需要花几个小时搞清楚这个工具到底是怎么运转的：Chat 和 Cowork 的区别，为什么长而详细的提示词比短的能产出好得多的结果，如何构建一个编码你判断力的 Skill，如何把 Skills 打包成任何同事都能使用的 plugin。

下载桌面应用。选出你做得最频繁的任务。写一个提示词，详细描述你希望它如何完成。看看结果。然后构建你的第一个 Skill。回报复利得很快。