当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于序列增强胶囊网络的刑事案件罪名预测方法技术

技术编号:21850921 阅读:37 留言:0更新日期:2019-08-14 00:24
本发明专利技术涉及智能法律领域,尤其涉及一种基于序列增强胶囊网络的刑事案件罪名预测方法。包括以下步骤:S1构建训练数据集,获取案件的事实描述以及罪名判罚结果作为训练数据;S2构建序列增强胶囊网络模型并通过训练数据进行训练;S3通过S2训练之后的序列增强胶囊网络模型,将新的案件的事实描述文本输入到序列胶囊网络模型中,模型自动预测相应罪名作为罪名预测结果。本发明专利技术提出的模型不仅能较好地捕捉到法律文本的显著特征和语义信息,而且在低频罪名预测问题上具有较好的竞争力;引入了focal loss损失函数,作为序列增强胶囊网络模型的损失函数,进一步缓解了低频罪名预测任务的罪名高度不平衡问题。

A Crime Prediction Method for Criminal Cases Based on Sequence Enhanced Capsule Network

【技术实现步骤摘要】
一种基于序列增强胶囊网络的刑事案件罪名预测方法
本专利技术涉及智能法律领域,尤其涉及一种基于序列增强胶囊网络的刑事案件罪名预测方法。
技术介绍
近年来,以深度学习和自然语言处理为代表的人工智能技术取得巨大突破,开始在智能法律领域崭露头角,受到了学术界与产业界的广泛关注。智能法律赋予机器理解法律文本、分析案例的能力,能根据案件进行智能办案。自动罪名预测作为智能法律中最具有表性的子任务之一,在法律助理系统中发挥着重要的作用,在现实生活中也有着广泛的应用。例如,它可以为法律专家(如律师和法官)提供案件被告人的罪名参考,以此辅助法官判案,提高工作效率;同时可以为不熟悉法律术语和复杂程序的普通人提供法律咨询。自动罪名预测是利用机器学习或深度学习技术训练机器法官判断案件被告人的罪名(如盗窃、抢劫、交通肇事等)。以前的研究工作提出了许多实现自动罪名预测的方法。这些方法主要分为三类:(1)传统方法;(2)机器学习方法;(3)深度学习方法。传统方法常采用数学公式或者定量计算。Kort[FredKort.PredictingSupremeCourtdecisionsmathematically:Aquantitativeanalysisofthe“righttocounsel”cases.AmericanPoliticalScienceReview,1957,51(1):1–12]试图运用定量方法预测通常被认为高度不确定的人类事件,即美国最高法院的判决。该研究旨在证明,至少在司法审查的一个领域,用一些已经决策的案件来确定影响决策的事实因素,用公式求出这些因素的数值,然后在指定的领域中正确地预测剩余案件的决策。Nagel[StuartSNagel.Applyingcorrelationanalysistocaseprediction.Tex.L.Rev.,1963,42:1006]认为可以科学地预测诉讼结果,他利用重新分配的例子证明了通过对案例中出现的四个变量分配相关系数,预测是可能的。这一预测将有助于规划诉讼的当事人、理解司法程序的理论家、解释司法反应的立法者以及寻求遵守法律的公众。Keown[RKeown.Mathematicalmodelsforlegalprediction.Computer/LJ,1980,2:829]提出了用数学方法预测司法判决的可行性。他利用Haar、Sawyer和Cummings的线性模型法以及Mackaay和Robillard的最近邻法在1000多个案例中,正确预测了99%的决策。这种成功为在其他特殊领域开发线性模型提供了真正的机会和迫切的需要,这不仅是为了从经验上验证该方法在一般情况下是有效的,而且还为法律行业提供了额外的预测模型。这些传统的方法在某些场景中取得了一些效果,但它们仅限于具有少量标签的小数据集。由于机器学习在许多领域的成功,研究人员开始使用机器学习方法来处理罪名预测。这类工作通常侧重于从案例事实中提取特征,然后使用机器学习算法进行预测。Liu等人[Chao-LinLiu,Cheng-TsungChang,Jim-HowHo.Caseinstancegenerationandrefinementforcase-basedcriminalsummaryjudgmentsinChinese.2004.,Chao-LinLiu,Chwen-DarHsieh.Exploringphrase-basedclassificationofjudicialdocumentsforcriminalchargesinchinese.In:ProcofInternationalSymposiumonMethodologiesforIntelligentSystems.Springer,2006,681–690]提出了一种基于K-NearestNeighbor(KNN)算法,用于从现实世界的判决文本中自动生成和细化用于刑事简易判决的案件实例。该算法试图从过去的诉讼文件中提取重要的法律信息来构建案例实例,然后通过合并相似的案例并从案例中删除相对不相关的信息来细化这些案例实例。Lin等人[Wan-ChenLin,Tsung-TingKuo,Tung-JiaChang.ExploitingmachinelearningmodelsforChineselegaldocumentslabeling,caseclassification,andsentencingprediction.ROCLINGXXIV(2012),2012.140]针对“强盗罪”与“恐吓取财罪”定义21种法律要素标签,然后利用法律要素资讯来分类来分类“强盗罪”与“恐吓取财罪”以及预测此两种罪的判处刑期。Mackaay等人[EjanMackaay,PierreRobillard.Predictingjudicialdecisions:Thenearestneighborruleandvisualrepresentationofcasepatterns.1974]通过聚类语义相似的N-grams来提取特征。Sulea等人[Octavia-MariaSulea,MarcosZampieri,ShervinMalmasi,etal.ExploringtheUseofTextClassificationintheLegalDomain.CoRR,2017,abs/1710.09306]利用法国最高法院的案例和裁决,调查了文本分类方法在法律领域的应用,然后提出了一种基于支持向量机的案件描述、时间跨度和判决特征的判决系统,以预测案件的法律领域和判决方面的准确性。然而,这些方法仅提取浅层文本特性或手动标记,很难在大的数据集上收集这些特征。因此,当数据量很大时,它们的性能不会很好。近年来,随着深度神经网络在自然语言处理(NLP)、计算机视觉(CV)和语音领域的成功,一些工作开始将其应用到自动罪名预测任务中,并显示出巨大的性能提升。Luo等人[BingfengLuo,YansongFeng,JianboXu,etal.LearningtoPredictChargesforCriminalCaseswithLegalBasis.arXivpreprintarXiv:1707.09168,2017.]认为相关法律条文在这一任务对罪名预测任务起着非常重要的作用。因此提出了一种基于注意力的神经网络方法,将罪名预测任务和相关条文提取任务在统一的框架下进行联合建模,从而能够有效预测不同表达方式案件的适当罪名。然而,这项工作不能解决低频罪名预测以及多重罪名预测的问题。Zhong等人[HaoxiZhong,GuoZhipeng,CunchaoTu,etal.LegalJudgmentPredictionviaTopologicalLearning.In:ProcofProceedingsofthe2018ConferenceonEmpiricalMethodsinNaturalLanguageProcessing.2018,3540–3549]通过考虑到法律条文中的罪名、法条、罚款、处罚期限这些子任务之间的拓扑依赖关系,提出了一种拓扑多任务学习的框架,将多个子本文档来自技高网...

【技术保护点】
1.一种基于序列增强胶囊网络的刑事案件罪名预测方法,其特征在于,该方法包括以下步骤:S1构建训练数据集,获取案件的事实描述以及罪名判罚结果作为训练数据;S2构建序列增强胶囊网络模型并通过训练数据进行训练,包括以下步骤:S2.1构建序列增强胶囊网络模型,具体步骤如下:S2.1.1构建初始胶囊层:对案件的事实描述文本进行分词,并映射为词向量序列,将其作为初始胶囊层u={u1,u2,...,un};S2.1.2构建Multiple seq‑caps层:通过对S2.1.1得到的初始胶囊层u,利用Multipleseq‑caps层提取特征,得到案件事实描述文本的主要特征向量;S2.1.3构建attention层,对S2.1.1得到的初始胶囊层u使用注意力机制,得到案件事实描述文本的辅助特征向量c;S2.1.4构建输出层,将S2.1.2得到的案件事实描述文本的主要特征向量以及S2.1.3得到的案件事实描述文本的辅助特征向量c结合起来,并输送给全连层网络;S2.2训练序列增强胶囊网络模型;S3通过S2训练之后的序列增强胶囊网络模型,将新的案件的事实描述文本输入到序列胶囊网络模型中,模型自动预测相应罪名作为罪名预测结果。...

【技术特征摘要】
1.一种基于序列增强胶囊网络的刑事案件罪名预测方法,其特征在于,该方法包括以下步骤:S1构建训练数据集,获取案件的事实描述以及罪名判罚结果作为训练数据;S2构建序列增强胶囊网络模型并通过训练数据进行训练,包括以下步骤:S2.1构建序列增强胶囊网络模型,具体步骤如下:S2.1.1构建初始胶囊层:对案件的事实描述文本进行分词,并映射为词向量序列,将其作为初始胶囊层u={u1,u2,...,un};S2.1.2构建Multipleseq-caps层:通过对S2.1.1得到的初始胶囊层u,利用Multipleseq-caps层提取特征,得到案件事实描述文本的主要特征向量;S2.1.3构建attention层,对S2.1.1得到的初始胶囊层u使用注意力机制,得到案件事实描述文本的辅助特征向量c;S2.1.4构建输出层,将S2.1.2得到的案件事实描述文本的主要特征向量以及S2.1.3得到的案件事实描述文本的辅助特征向量c结合起来,并输送给全连层网络;S2.2训练序列增强胶囊网络模型;S3通过S2训练之后的序列增强胶囊网络模型,将新的案件的事实描述文本输入到序列胶囊网络模型中,模型自动预测相应罪名作为罪名预测结果。2.一种根据权利要求1所述基于序列增强胶囊网络的刑事案件罪名预测方法,其特征在于:S1中的数据集来自于中国裁判文书网公开的真实刑事案件,每件案件包括两个部分:案件的事实描述和罪名判罚结果,将其作为训练数据。3.一种根据权利要求1所述基于序列增强胶囊网络的刑事案件罪名预测方法,其特征在于:S2.1.1中分词采用的是北京大学开源工具pkuseg,并利用Embedding技术将Word...

【专利技术属性】
技术研发人员:彭黎何从庆
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1