一种基于序列增强胶囊网络的刑事案件罪名预测方法技术

技术编号：21850921 阅读：37 留言：0更新日期：2019-08-14 00:24

本发明专利技术涉及智能法律领域，尤其涉及一种基于序列增强胶囊网络的刑事案件罪名预测方法。包括以下步骤：S1构建训练数据集，获取案件的事实描述以及罪名判罚结果作为训练数据；S2构建序列增强胶囊网络模型并通过训练数据进行训练；S3通过S2训练之后的序列增强胶囊网络模型，将新的案件的事实描述文本输入到序列胶囊网络模型中，模型自动预测相应罪名作为罪名预测结果。本发明专利技术提出的模型不仅能较好地捕捉到法律文本的显著特征和语义信息，而且在低频罪名预测问题上具有较好的竞争力；引入了focal loss损失函数，作为序列增强胶囊网络模型的损失函数，进一步缓解了低频罪名预测任务的罪名高度不平衡问题。

A Crime Prediction Method for Criminal Cases Based on Sequence Enhanced Capsule Network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于序列增强胶囊网络的刑事案件罪名预测方法
本专利技术涉及智能法律领域，尤其涉及一种基于序列增强胶囊网络的刑事案件罪名预测方法。
技术介绍
近年来，以深度学习和自然语言处理为代表的人工智能技术取得巨大突破，开始在智能法律领域崭露头角，受到了学术界与产业界的广泛关注。智能法律赋予机器理解法律文本、分析案例的能力，能根据案件进行智能办案。自动罪名预测作为智能法律中最具有表性的子任务之一，在法律助理系统中发挥着重要的作用，在现实生活中也有着广泛的应用。例如，它可以为法律专家(如律师和法官)提供案件被告人的罪名参考，以此辅助法官判案，提高工作效率；同时可以为不熟悉法律术语和复杂程序的普通人提供法律咨询。自动罪名预测是利用机器学习或深度学习技术训练机器法官判断案件被告人的罪名(如盗窃、抢劫、交通肇事等)。以前的研究工作提出了许多实现自动罪名预测的方法。这些方法主要分为三类：(1)传统方法；(2)机器学习方法；(3)深度学习方法。传统方法常采用数学公式或者定量计算。Kort[FredKort.PredictingSupremeCourtdecisionsmathematically:Aquantitativeanalysisofthe“righttocounsel”cases.AmericanPoliticalScienceReview,1957,51(1):1–12]试图运用定量方法预测通常被认为高度不确定的人类事件，即美国最高法院的判决。该研究旨在证明，至少在司法审查的一个领域，用一些已经决策的案件来确定影响决策的事实因素，用公式求出这些因素的数值，然后在指定...

【技术保护点】
1.一种基于序列增强胶囊网络的刑事案件罪名预测方法，其特征在于，该方法包括以下步骤：S1构建训练数据集，获取案件的事实描述以及罪名判罚结果作为训练数据；S2构建序列增强胶囊网络模型并通过训练数据进行训练，包括以下步骤：S2.1构建序列增强胶囊网络模型，具体步骤如下:S2.1.1构建初始胶囊层：对案件的事实描述文本进行分词，并映射为词向量序列，将其作为初始胶囊层u＝{u1，u2，...，un}；S2.1.2构建Multiple seq‑caps层：通过对S2.1.1得到的初始胶囊层u，利用Multipleseq‑caps层提取特征，得到案件事实描述文本的主要特征向量；S2.1.3构建attention层，对S2.1.1得到的初始胶囊层u使用注意力机制，得到案件事实描述文本的辅助特征向量c；S2.1.4构建输出层，将S2.1.2得到的案件事实描述文本的主要特征向量以及S2.1.3得到的案件事实描述文本的辅助特征向量c结合起来，并输送给全连层网络；S2.2训练序列增强胶囊网络模型；S3通过S2训练之后的序列增强胶囊网络模型，将新的案件的事实描述文本输入到序列胶囊网络模型中，模型自动预测相应罪名作为罪名预测结果。...

【技术特征摘要】
1.一种基于序列增强胶囊网络的刑事案件罪名预测方法，其特征在于，该方法包括以下步骤：S1构建训练数据集，获取案件的事实描述以及罪名判罚结果作为训练数据；S2构建序列增强胶囊网络模型并通过训练数据进行训练，包括以下步骤：S2.1构建序列增强胶囊网络模型，具体步骤如下:S2.1.1构建初始胶囊层：对案件的事实描述文本进行分词，并映射为词向量序列，将其作为初始胶囊层u＝{u1，u2，...，un}；S2.1.2构建Multipleseq-caps层：通过对S2.1.1得到的初始胶囊层u，利用Multipleseq-caps层提取特征，得到案件事实描述文本的主要特征向量；S2.1.3构建attention层，对S2.1.1得到的初始胶囊层u使用注意力机制，得到案件事实描述文本的辅助特征向量c；S2.1.4构建输出层，将S2.1.2得到的案件事实描述文本的主要特征向量以及S2.1.3得到的案件事实描述文本的辅助特征向量c结合起来，并输送给全连层网络；S2.2训练序列增强胶囊网络模型；S3通过S2训练之后的序列增强胶囊网络模型，将新的案件的事实描述文本输入到序列胶囊网络模型中，模型自动预测相应罪名作为罪名预测结果。2.一种根据权利要求1所述基于序列增强胶囊网络的刑事案件罪名预测方法，其特征在于：S1中的数据集来自于中国裁判文书网公开的真实刑事案件，每件案件包括两个部分：案件的事实描述和罪名判罚结果，将其作为训练数据。3.一种根据权利要求1所述基于序列增强胶囊网络的刑事案件罪名预测方法，其特征在于：S2.1.1中分词采用的是北京大学开源工具pkuseg，并利用Embedding技术将Word...

【专利技术属性】
技术研发人员：彭黎，何从庆，
申请(专利权)人：湖南大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人