一种基于深度学习的裁判文书自动生成方法及系统技术方案

技术编号：23315546 阅读：159 留言：0更新日期：2020-02-11 17:57

本发明专利技术公开了一种基于深度学习的裁判文书自动生成方法及系统，本发明专利技术充分研究不同类型裁判文书案由的通常表述，结合同类型案由的基本情况，根据每种类型案由的要素分类情况标注裁判文书涉及的案由要素，将标注数据划分为训练集和测试集；利用深度学习算法建立序列模型，将LSTM作为模型的编码器和解码器；利用训练集和测试集训练和测试模型，通过案由要素实现裁判文书自动生成，可以有效提高裁判文书制作的效率与准确率，本发明专利技术还能够高速有效的生成一篇规范的裁判文书，并且本发明专利技术中的裁判文书生成的逻辑更加通顺。

An automatic generation method and system of judgment documents based on deep learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的裁判文书自动生成方法及系统
本专利技术涉及自然语言处理领域，具体地，涉及一种基于深度学习的裁判文书自动生成方法及系统。
技术介绍
裁判文书是人民法院结合当事人的请求事项或者争议事项进行审理后，根据具体的案件情况向当事人下发的具有法律意义的文书。目前，裁判文书生成主要有两种方式：一种由审判人员人工“套改”已有类似案件的裁判文书生成；另一种使用OCR识别技术抓取起诉状、答辩状等诉讼材料中有限的信息生成。现有裁判文书生成方法生成的文书类型、案号、当事人信息、审判人员信息等相对简单，可以较好生成固定部分的案由事实，但是无法有效处理核心部分的案由事实的生成。每个案件的案由事实都存在或多或少的差异，使用OCR技术识别起诉状、答辩状等诉讼材料抓取的部分事实信息，不仅文字识别正确率不高，且无法提供真正符合人民法院使用的案由事实，仍然需要审判人员做大量修改。
技术实现思路
为了更加高效、准确地实现裁判文书的自动生成，解决使用OCR技术识别直接抓取信息的弊端，本专利技术充分研究不同类型裁判文书案由的...

【技术保护点】
1.一种基于深度学习的裁判文书自动生成方法，其特征在于，所述方法包括：/n将案由划分为不同类型；/n总结每种类型案由的要素并分类；/n采集样本数据，样本数据包括不同类型案由对应的裁判文书，根据每种类型案由的要素分类情况，标注每种类型案由对应的裁判文书；/n针对每种类型案由分别建立相应的要素表，要素表第一列为标注的要素，要素表第二列为标注的要素对应的类型和值；/n基于所有建立的要素表获取数据集，将数据集划分为训练集和测试集；/n构建深度学习模型，利用训练集和测试集训练和测试深度学习模型；/n针对不同类型案由对应的要素表中不同类型要素对应的要素内容，将裁判文书输入训练后的深度学习模型，输出裁判文书...

【技术特征摘要】
1.一种基于深度学习的裁判文书自动生成方法，其特征在于，所述方法包括：
将案由划分为不同类型；
总结每种类型案由的要素并分类；
采集样本数据，样本数据包括不同类型案由对应的裁判文书，根据每种类型案由的要素分类情况，标注每种类型案由对应的裁判文书；
针对每种类型案由分别建立相应的要素表，要素表第一列为标注的要素，要素表第二列为标注的要素对应的类型和值；
基于所有建立的要素表获取数据集，将数据集划分为训练集和测试集；
构建深度学习模型，利用训练集和测试集训练和测试深度学习模型；
针对不同类型案由对应的要素表中不同类型要素对应的要素内容，将裁判文书输入训练后的深度学习模型，输出裁判文书案由的基本事实内容。

2.根据权利要求1所述的一种基于深度学习的裁判文书自动生成方法，其特征在于，案由类型包括：劳动争议案由、离婚案由、民间借贷案由。

3.根据权利要求1所述的一种基于深度学习的裁判文书自动生成方法，其特征在于，将数据集按照比例8:2划分为训练集和测试集。

4.根据权利要求1所述的一种基于深度学习的裁判文书自动生成方法，其特征在于，构建深度学习模型，利用训练集和测试集训练和测试深度学习模型，具体包括：
将sequence-to-sequence模型的编码器和解码器均定义为一系列长短期记忆网络；
将数据集的第一列数据作为编码器的输入，将对应的第二列文段作为解码器的输出，构建sequence-to-sequence模型；
sequence-to-sequence模型的编码器将输入的每个文字作为一个输入，输入内容以x=(x1，x2，…,xJ）形式保存，其中J代表输入文字的总长度，编码器将输入的x转换成隐藏层的信息内容，同时解码器将隐藏层的信息内容作为输入，并输出y=(y1，y2，…,yT)，其中T代表输出文字的总长度，通过反向传播学习模型参数，并利用测试集验证，得到训练后的模型。

5.根据权利要求2所述的一种基于深度学习的裁判文书自动生成方法，其特征在于，劳动争议案由的要素类型分为五类：劳动者入职时间、劳动者离职时间、劳动合同约定工资、劳动者离职前12个月平均工资和劳动者离职原因；离婚案由的要素类型分为四类：确定恋爱的关系时间、登记结婚时间、婚姻登记机关和需要抚养的生育子女个数；民间借贷案由的要素类型分为六类：债权凭证签订...

【专利技术属性】
技术研发人员：李鑫，王竹，翁洋，其他发明人请求不公开姓名，
申请(专利权)人：四川大学，成都星云律例科技有限责任公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人