
场景与挑战
斯曼森是一家专注于人工智能技术及应用研发的科技创新企业,致力于通过生成式AI等先进技术手段提升企业运营质量和效率。过去一年,斯曼森自行研发了法律领域的“鳀鲸”法律大模型以及与其配套的法律服务平台,并为多个行业的客户开发及部署了定制化AI Agent应用方案。
斯曼森的法律咨询场景主要围绕用户输入的案情概述展开,具体流程如下。

用户输入案情概述:用户通过系统录入一段关于案件的文字描述,可能包含案件背景、当事人信息以及相关事件。
模型分析与归类:模型对输入文本进行处理,分析案情内容并将其归类到特定的法律类别,同时识别出适用的案由。
关键事实与证据识别:模型提取案件中的核心事实和相关证据,为后续分析提供基础。
缺失信息分析:模型进一步分析案件材料中可能缺失的重要事实和证据信息。
信息挖掘:最终,模型以对话的形式对当事人用户未提及的案情缺失信息进行挖掘和记录,帮助法律从业人员快速理解案件关键点并计划后续工作。
在这一场景中,斯曼森选择微调(Fine-tuning)而非检索增强生成(RAG)主要在于微调能够针对法律咨询任务进行深度优化,使模型更擅长处理法律术语、案由分类和事实提取,同时法律条款和案例更新频率低,微调后的模型可以长期适应这一静态环境,无需频繁更新知识库。这样在特定领域内训练后更准确地理解复杂案件背景,有效减少生成虚假或不准确信息的风险。
在整个流程中,数据是实现成功微调的关键因素。法律行业存在大量的案例数据。通过不断更新和完善现有案例库,斯曼森能够确保模型始终保持最新状态,从而提高法律咨询服务的准确性和效率。
但如何把各种案例数据转变为可微调的数据集,是一个非常重要的调整,数据处理过程占用了斯曼森算法团队大量的时间,而微调这样一个法律大模型需要大量的数据。
解决方案
为了满足斯曼森在法律咨询场景中的需求,采用亚马逊云科技的Fine-tuning Dataflow解决方案,基于数据流(Dataflow)构建整个微调流水线,以提升大语言模型(LLM)在法律领域的表现。

流程如下:
数据获取:首先,通过多种渠道收集法律相关的数据。
数据清洗:对收集到的数据进行清洗,移除个人识别信息(PII)、纠正拼写和语法错误、去除无关内容,以提高数据质量。
数据质量控制:通过随机抽样检查、统计分析等方法,确保数据集的质量符合训练要求。
数据格式化和标准化:将清洗后的数据转换为统一格式,以便于后续的模型训练。不同模型可能有特定的格式要求。
数据扩增:利用同义词替换、回译等技术对数据进行扩增,以增加样本数量和多样性,从而提升模型的泛化能力。
这个过程充分发挥了Amazon Nova这款大语言模型成本合理、使用便利的优势,使用Amazon Nova Pro再结合亚马逊云科技的微调数据流(Fine-tuning Dataflow)解决方案,进行扩展和优化,以下是具体的实现细节。
{
"instruction": "我想咨询一下民间借贷案件,请问您能帮我分析一下需要补充哪些关键信息和证据吗?",
"input": "我在2022年6月1日借给谢某元19万元用于养牛,当时他给我出具了借条并签字按手印。借条上约定了利息和还款期限,他通过银行转账收到了借款,但到现在只还了1.2万元。",
"output": "这是一个典型的民间借贷纠纷案件。根据您提供的信息,我已经了解了基本情况。为了更好地帮助您,我需要进一步了解一些细节。",
"markerSummary": "案情已经涉及到的关键事实和关键证据如下:\n\n关键事实:\n1. 借款发生时间为2022年6月1日\n2. 借款金额为19万元\n3. 借款用途为养牛\n4. 谢某元已还款1.2万元\n\n关键证据:\n1. 谢某元签字按手印的借条(载明借款金额、利息和还款期限)\n2. 银行转账记录(借款支付凭证)\n3. 1.2万元还款记录",
"history": [ [ "借条上的利息约定具体是什么?违约金有约定吗?",
"借条上约定月息1%,利息半年结一次,总共利息20900元。借条上没有约定违约金。"
],
[ "您是否有向对方催收过款项?用什么方式催收的?",
"我通过电话和微信多次催收,但对方一直拖延。"
],
[ "除了借条和转账记录,您是否保留了与对方关于借款和催收的微信聊天记录?",
"有保存一些催款的微信记录,但不是很完整。"
],
[ "借条上是否写明了借款用途?",
"我今年28岁了"
],
[ "对不起,您的回答我不大理解,我想知道你们当时的借条上是否写明了借款用途?",
"是的,借条上写明了是用于养牛发展。"
],
[ "借条上双方的身份信息是否完整?",
"借条上写明了双方的姓名,但没有写身份证号。"
],
[ "对方对借款事实是否有异议?",
"目前对方承认借款事实,只是一直没有按约定还款。"
],
[ "您和对方是否约定了发生纠纷时的管辖法院?",
"借条上没有约定管辖法院。"
]]
}
复制
左右滑动查看完整示意
需要构建这样一组的问题,通过相关的prompt生成整个数据:
请根据法院判决的案例内容和律师的问题列表,生成类似的指令-回答对,要求模拟律师询问用户案情的对话形式。律师根据用户已经提供的信息,分析并询问用户还需要补充哪些关键事实和关键证据。生成的数据应符合以下要求:
1. 指令必须用中文陈述,长度在1-2句话,力求完整、准确、简洁。
2. 严格按照数据格式中的每个属性值的要求来生成内容。
3. 必须输出json数据格式。
数据格式为:
[
{
"instruction": "人类指令。根据案件情况,还需要补充哪些关键事实和关键证据。例子:"根据案件的具体情况,还需补充哪些关键事实和关键证据信息?" ",
"input": "人类输入。根据法院判决的案例内容生成一段人类自己简单描述案件的内容",
"output": "模型回答。分析出此类案件所属什么纠纷。例子:"您的案件属于民间借贷纠纷,为了更好地了解案情帮您解决问题,我需要了解一些细节信息。",
"markerSummary":"对于律师的问题列表中用户已经涉及到的部分进行标记总结"
"history": [
["第一轮指令", "第一轮回答"],
["第二轮指令", "第二轮回答"],
"... 回答对数保持7-12个左右"
]
"docFormat": {
"format": "markdown",
"template": "### 标题\n{title}\n\n### 案由\n{case_type}\n\n### 案情介绍\n{case_description}\n\n### 焦点清单\n{focus_points}\n\n### 证据清单\n{evidence_list}",
}
]
复制
左右滑动查看完整示意
通过这样的方式,基于各类案例,生成了超过6000条数据,在完成数据后,将数据自动存储到Amazon S3,并用Amazon SageMaker对基座模型Qwen1.5 7b进行Lora微调。

最终将模型部署于亚马逊云科技宁夏区域,确保其能够高效地服务于用户,并根据实际使用情况进行动态调整和优化,以及后续的微调。
效果提升
通过该模型可以快速提供案件咨询,实现在对当事人案情充分了解的前提下给出专业的建议。

在10000测试集数据的基础上,本文将“鳀鲸”模型与其他法律模型进行了全面对比评估。
模型基础评估

专业评估
邀请法律专家进行人工评估,来进一步验证模型的实际应用效果。

综合结果
案情识别能力:“鳀鲸”模型在案情识别准确率方面达到了99%,比对照组提升9个百分点,这一结果表明模型能够准确理解和分析复杂的法律案件。
问题生成质量:在问题的相关性和完整性方面提升显著,“鳀鲸”模型达到92%的高水平,相比对照组提升了22个百分点,显示出模型在法律咨询场景中的专业性。
专业认可度:法律专家的满意度评分从60%提升至90%,增长了30个百分点,显著提升验证了“鳀鲸”模型在实际应用中的专业价值和实用性。
综合评估结果显示,经过微调的“鳀鲸”模型在各项关键指标上都取得了显著提升,特别是在专业性和准确性方面的表现尤为突出,这些改进直接提升了法律咨询服务的质量和效率。
总 结
通过与亚马逊云科技的紧密合作,斯曼森成功构建了一个专门针对法律行业的大语言模型。该模型不仅能够高效处理用户输入的案情概述,还能分析案件、识别关键事实和证据,并主动挖掘当事人未提及的案情缺失信息,帮助法律从业人员快速理解案件要点。
在整个过程中,Amazon Nova高效的模型能力和Amazon SageMaker便捷的微调流程为模型的成功实施提供了有力支持。通过持续的数据更新和完善,斯曼森将不断优化、更新模型,从而提高AI法律咨询服务的可用性,准确性和效率。
本篇作者
方亮
苏州斯曼森信息技术有限公司创始人。在归国创立斯曼森之前曾在微软等多家大厂任职,积累了丰富的研发、项目和团队管理经验。作为技术类创始人,方亮始终对前沿科技高度关注,致力于新技术与行业的深度融合、创新发展,以此为行业创造出新型生产力,推动行业不断向前迈进。
曹镏
亚马逊云科技解决方案架构师,拥有 16 年企业级架构设计经验。作为生成式 AI 落地实践的专家,专注企业数字化咨询与架构设计,已成功帮助 50+ 家企业完成 AI 转型,涵盖零售、制造、金融、教育等核心行业。主导构建百卡规模的企业级 AI 基础设施,开源多个企业级 AI 项目,累计获得 1000+ Stars。目前专注于大模型在企业场景的创新应用,包括 AI 治理平台、Agentic AI、智能硬件等关键领域以及相关解决方案。













期待你的分享 收藏 在看 点赞!
亚马逊的一小步,云计算的一大步!

点击阅读原文,获取更多精彩内容!