一种基于相似文本的案件繁简分流方法技术

技术编号：24853512 阅读：47 留言：0更新日期：2020-07-10 19:07

本发明专利技术涉及一种基于相似文本的案件繁简分流方法，包括如下步骤：1)建立数据库，并在数据库中储存样本案件的文本信息；2)获取待分流案件的文本信息，并与数据库中的各样本案件进行相似度分析，得到待分流案件的相似度比例值；3)根据得到的相似度比例值以及预设的相似度比例阈值，对待分流案件进行分流。本发明专利技术提供的基于相似文本的案件繁简分流方法，解决了案件繁简分流中存在的繁简程度无法量化、繁简划分标准不固定、繁简分类无法适应现实需要等难点，可以广泛应用于案件分流领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于相似文本的案件繁简分流方法
本专利技术涉及数据处理分流领域，具体涉及一种基于相似文本的案件繁简分流方法。
技术介绍
随着我国经济社会的快速发展，同时受人口基数的影响，全国各级法院面临的审判工作压力越来越严重，“案多人少”的矛盾将持续加剧。通常，一个案件应当由三位法官组成合议庭进行审理，根据三位法官各自的意见，按照少数服从多数的原则决定最终的判决结果，以此来保证判决结果的正确性。为了缓解“案多人少”的现实状况，尽可能保证所有案件都能得到及时的处理，我国法律规定了由一位法官独自审理的案件审理程序，即“简易程序”。这是一种效率至上、兼顾公平的方法，它的逻辑是，如果一个案件的事实清楚简单，那么没有必要投入三位法官进行审理，因为这三位法官的意见极有可能完全一致，没有差别。简易程序的出现有效缓解了“案多人少”的矛盾，但对于什么样的案件应当使用简易程序、什么样的案件应当使用普通程序，以及如何从大量的新收案件中区分这两类案件，目前都存在问题和困难。通常将应当使用简易程序的案件称为“简案”，应当使用普通程序的案件称为“繁案”，...

【技术保护点】
1.一种基于相似文本的案件繁简分流方法，其特征在于，包括以下步骤；/n1)建立数据库，并在数据库中储存样本案件的文本信息；/n2)获取待分流案件的文本信息，并与数据库中的各样本案件进行相似度分析，得到待分流案件的相似度比例值；/n3)根据得到的相似度比例值以及预设的相似度比例阈值，对待分流案件进行繁简分流。/n

【技术特征摘要】
1.一种基于相似文本的案件繁简分流方法，其特征在于，包括以下步骤；
1)建立数据库，并在数据库中储存样本案件的文本信息；
2)获取待分流案件的文本信息，并与数据库中的各样本案件进行相似度分析，得到待分流案件的相似度比例值；
3)根据得到的相似度比例值以及预设的相似度比例阈值，对待分流案件进行繁简分流。

2.如权利要求1所述的一种基于相似文本的案件繁简分流方法，其特征在于，所述步骤2)中，获取待分流案件的文本信息，并与数据库中的各样本案件进行相似度分析，得到待分流案件的相似度比例值的方法，包括以下步骤：
2.1)获取待分流案件的文本信息，并与数据库中的任一样本案件进行比较，计算待分流案件与该样本案件的文本相似度；
2.2)设定相似度阈值，若待分流案件与该样本案件的文本相似度不小于相似度阈值，则认为该样本案件为待分流案件的相似文本案件；
2.3)重复步骤2.1)～2.2)，判断数据库中所有样本案件是否为待分流案件的相似文本案件，得到所有样本案件中的相似文本案件的数量；
2.4)计算相似文本案件在所有样本案件中所占的比例，作为待分流案件的相似度比例值。

3.如权利要求2所述的一种基于相似文本的案件繁简分流方法，其特征在于，所述步骤2.1)中，获取待分流案件的文本信息，并与数据库中的任一样本案件进行比较，计算待分流案件与该样本案件的文本相似度的方法，包括以下步骤：
2.1.1)建立文本相似度计算模型，所述文本相似度计算模型包括嵌入层、长短期记忆神经网络层、卷积神经网络层、额外特征层和输出层；
2.1.2)将待分流案件与该样本案件的文本信息分别映射到嵌入层，得到待分流案件和样本案件的文本特征矩阵，并输出到长短期记忆神经网络层和卷积神经网络层；
2.1.3)在长短期记忆神经网络层中分别提取待分流案件与样本案件的第一文本特征信息，同时在卷积神经网络层中分别提取待分流案件与样本案件的第二文本特征信息，并将长短期记忆神经网络层与卷积神经网络层中提取得到的第一文本特征信息和第二文本特征信息均输出到额外特征层；
2.1.4)在额外特征层中，分别根据待分流案件和样本文件的第一文本特征信息和第二文本特征信息得到二者的总的文本特征信息，根据二者的总的文本特征信息，计算得到待分流案件和样本文件的法律重叠词分数和法律要素对比向量；
2.1.5)在输出层中，综合考虑待分流案件的文本特征信息、样本案件的文本特征信息、法律重叠词分数及法律要素对比向量，计算得到待分流案件与样本案件的文本相似度。

<...

【专利技术属性】
技术研发人员：张建悦，张吉豫，邓矜婷，熊丙万，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人