一种自动切分法律文书的方法、系统、设备及存储介质技术方案

技术编号：42053276 阅读：34 留言：0更新日期：2024-07-16 23:32

本发明专利技术实施例公开了一种自动切分法律文书的方法、系统、设备及存储介质，本发明专利技术实施例在接收到待切分的法律文书卷宗后，利用OCR对所述法律文书卷宗进行识别，获取第一法律文书信息；对预设BERT模型进行预设次数的迭代训练，生成完成初步训练的第一BERT模型，利用微调分类器对所述第一BERT模型进行微调，生成第二BERT模型；将所述第一法律文书信息输入至所述第二BERT模型中进行自动切分，生成切分后的第二法律文书信息。本发明专利技术实施例实现对经过OCR识别后的法律文书的自动切分，且切分结果更加精准高效，能够对多样性文档类型的切分，这使得电子卷宗中不同媒体类型的内容都能得到准确切分，提高了电子卷宗处理的全面性和实用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及人工智能，具体涉及一种自动切分法律文书的方法、系统、设备及存储介质。

技术介绍

1、随着社会的发展和法律行业的进步，法律文书的处理量呈现出快速增长的趋势。传统的法律文书处理方法往往依赖于人工操作，使用手工设计的特征和规则。流程包括数据预处理、特征提取、分类和切分，效率低下且容易出错。而且基于规则、关键词匹配或传统机器学习方法，但这些方法限制了适应性和泛化能力，有很强的领域依赖性且难以处理多样性文档，切分准确性不足。

技术实现思路

1、为此，本专利技术实施例提供一种自动切分法律文书的方法、系统、设备及存储介质，以解决现有技术使用手工设计的特征和规则有很强的领域依赖性且难以处理多样性文档，切分准确性不足的技术问题。

2、为了实现上述目的，本专利技术实施例提供如下技术方案：

3、根据本专利技术实施例的第一方面，提供了一种自动切分法律文书的方法，其特征在于，所述方法包括：

4、s1、接收待切分的法律文书卷宗，利用ocr对所述法律文书卷宗进行识...

【技术保护点】

1.一种自动切分法律文书的方法，其特征在于，所述方法包括：

2.如权利要求1所述的一种自动切分法律文书的方法，其特征在于，对预设BERT模型进行预设次数的迭代训练，捕捉文本的词义与上下文信息并提取特征，包括：

3.如权利要求2所述的一种自动切分法律文书的方法，其特征在于，根据所提取的特征自动学习特征与规则，生成完成初步训练的第一BERT模型，包括：

4.如权利要求3所述的一种自动切分法律文书的方法，其特征在于，利用微调分类器对所述第一BERT模型进行微调，生成第二BERT模型，包括：

5.如权利要求4所述的一种自动切分法律文书的方法，其特征...

【技术特征摘要】

1.一种自动切分法律文书的方法，其特征在于，所述方法包括：

2.如权利要求1所述的一种自动切分法律文书的方法，其特征在于，对预设bert模型进行预设次数的迭代训练，捕捉文本的词义与上下文信息并提取特征，包括：

3.如权利要求2所述的一种自动切分法律文书的方法，其特征在于，根据所提取的特征自动学习特征与规则，生成完成初步训练的第一bert模型，包括：

4.如权利要求3所述的一种自动切分法律文书的方法，其特征在于，利用微调分类器对所述第一bert模型进行微调...

【专利技术属性】
技术研发人员：王荣刚，
申请(专利权)人：北京汉王影研科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人