一种基于多种神经网络组合的量刑计算方法技术

技术编号：21091160 阅读：33 留言：0更新日期：2019-05-11 10:32

一种基于多种神经网络组合的量刑计算方法，包括以下步骤：步骤S1、构建训练数据集，从裁判文书网中获取文书训练集，切分出案情描述和判决刑期，对每一条案情描述文本训练词向量，统计刑期区间并划分类别，训练量刑类别划分器；步骤S2、对待计算刑期的案情描述文本查询词向量后，输入步骤S1得到的量刑类别划分器进行分类，预测出量刑区间，使用区间中统计的代表值作为刑期结果。本发明专利技术克服了传统特征分析方法过于复杂、消耗人力资源多、专家系统质量不高的缺陷，该量刑计算方法能够在可靠的文书数据量下有效拟合出特定的量刑计算模型，解决了案情描述文本量刑计算效果不佳的问题，将本发明专利技术的方法应用到量刑计算中能够使预测性能明显提升。

A Sentencing Method Based on Multiple Neural Network Combination

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多种神经网络组合的量刑计算方法
本专利技术涉及司法智能化领域，具体涉及一种基于多种神经网络组合的量刑计算方法。
技术介绍
量刑计算属于人工智能在司法领域中的应用，是为法院中的卷宗审阅者根据案情描述提供有参考价值的量刑建议的方法，在法院中存在大量的需求。目前，随着电子科技产业的迅速发展，卷宗管理进入了电子化时代，这些卷宗数据呈现出爆炸式增长。例如，在“裁判文书网”上，保存了五千四百多万篇文书。为了能更好地应对如此快速增长的信息量，从中找到有效的相似参考信息，基于人工智能的量刑计算等智能法律服务应运而生。文书数据具有行文风格严谨、数据规整、乱码少等特点，但文书类别会分为很多种，比如，从案由的角度可以分为刑事案由、民事案由、行政案由；从审判程序可以分为一审、再审、非诉执行审查、再审审查与审判监督等；从文书类型可以分为判决书、裁定书、调解书、决定书、通知书等。面对各种各样的类别，如何有效处理不同类别的差异是一个巨大的挑战。目前的量刑计算系统研究大多处于起步阶段，并且由于法律中大多数法律条文并不是直接给出应该加减刑期的年份和幅度数值，而是给出一个范围或区间，这就导致各地区甚至各法院间的刑期计算存在一定差异。传统的人工智能专家系统会对每个地区甚至每个法院的量刑习惯抽取特征并进行建模，但这种特征分析方法过于复杂，需要消耗大量的人力物力和时间，形成的量刑计算系统质量无法保证。而词向量和卷积神经网络、循环神经网络、循环卷积神经网络等深度学习算法非常适合从数据中挖掘隐含的特征，在可靠的文书数据量下能有效地拟合出特定的量刑计算模型。
技术实现思路
本专利技术的目的在于克服上...

【技术保护点】
1.一种基于多种神经网络组合的量刑计算方法，其特征在于，包括以下步骤：步骤S1、构建训练数据集，从裁判文书网中获取文书训练集，切分出案情描述和判决刑期，对每一条案情描述文本训练词向量，统计刑期区间并划分类别，训练量刑类别划分器；步骤S2、对待计算刑期的案情描述文本查询词向量后，输入步骤S1得到的量刑类别划分器进行分类，预测出量刑区间，使用区间中统计的代表值作为刑期结果。

【技术特征摘要】
1.一种基于多种神经网络组合的量刑计算方法，其特征在于，包括以下步骤：步骤S1、构建训练数据集，从裁判文书网中获取文书训练集，切分出案情描述和判决刑期，对每一条案情描述文本训练词向量，统计刑期区间并划分类别，训练量刑类别划分器；步骤S2、对待计算刑期的案情描述文本查询词向量后，输入步骤S1得到的量刑类别划分器进行分类，预测出量刑区间，使用区间中统计的代表值作为刑期结果。2.根据权利要求1所述基于多种神经网络组合的量刑计算方法，其特征在于：所述的步骤S1具体包括：步骤S1-1)将裁判文书网中的文书数据爬取并保存到存储介质；步骤S1-2)按照文书关键词切分出案情描述部分，再根据关键词抽取出判决刑期部分；步骤S1-3)从案情描述文本集合中得到语料，对语料进行切分词汇及去除停用词操作得到清洁语料，然后将清洁语料作为训练集训练词向量，从而得到精准语义词向量表；步骤S1-4)统计得到相关语料对应的刑期集合，按照数据等份的划分方法划分刑期区间，并且记录每个区间的刑期代表值，得到相关语料的量刑计算类别标签；步骤S1-5)将相关语料和量刑计算类别标签作为量刑类别划分器的训练集，将语料中的每个词通过查询步骤S1-3)得到的精准语义关系词向量表转化为向量，训练量刑类别划分器。3.根据权利要求2所述基于多种神经网络组合的量刑计算方法，其特征在...

【专利技术属性】
技术研发人员：王世晞，张亮，徐建忠，李娇娇，
申请(专利权)人：杭州世平信息科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人