当前位置: 首页 > 专利查询>中北大学专利>正文

一种法条推送方法及系统技术方案

技术编号:32031309 阅读:18 留言:0更新日期:2022-01-27 13:03
本发明专利技术公开了一种法条推送方法及系统,其中法条推送方法包括:获取法条司法解释集和历史诉讼案件集;建立法条司法解释集与历史诉讼案件集的映射关系,构建多标签分类模型;将当前诉讼案件的文本信息输入至多标签分类模型中,得到当前诉讼案件对应的多个法条的概率,多个法条组成备选法条集;从法条司法解释集中获取与备选法条集中的第一法条相关的司法解释,通过司法解释集计算法条间的相似度,根据相似度重新确定备选法条集中各个法条的概率,当法条的概率大于或等于第一阈值时,推送对应的法条。本发明专利技术的法条推送方法所推送的法条全面且准确。面且准确。面且准确。

【技术实现步骤摘要】
一种法条推送方法及系统


[0001]本专利技术涉及一种法条推送方法及系统,属于数据挖掘


技术介绍

[0002]近年,随着智能司法不断推进,越来越多的研究人员致力于智能司法的研究。智能司法是将人工智能与司法领域相结合,通过预测法条、罪名、量刑等因素提供给专业人员进行参考,辅助专业人员进行审判,提升办案效率。法条多标签自动推送作为智能司法研究任务当中的一个重要子任务,是构成智能司法的关键组成部分。例如案例“本院现查明:XX江盖桥下游顺水右岸垃圾乱堆乱放严重,现已侵占部分沿江道路,不仅影响正常交通还造成水体污染,生态环境遭到破坏;XX小河随处可见生活垃圾,且恶臭扑鼻,该气味传播很远,严重影响了周围空气质量”中,该例不仅造成了水污染,同时还涉及了固体污染以及大气污染,而智能司法的目的即是根据上述案例的文本信息自动推送相关的法条,给专业人员进行参考,辅助专业人员进行审判,提升办案效率。
[0003]目前多法条自动推送是采用多标签分类方法实现的。传统的法条多标签分类采用机器学习的方法。如Sulea等人提出了一种SVM的法律判决系统,输入法律范围辅助法律人员进行判决。Liu等人提出了一种三阶段预测算法,预测出法律案件涉及的法条。然而上述方法只能提取文本当中的浅层特征,通常会忽略法律文本中的自然顺序结构或上下文信息,这使得学习案件的语义信息变得困难,从而导致效果并不理想。
[0004]随着深度学习的发展,越来越多的研究人员将深度学习引入分类任务当中。但是现有基于深度学习的法条预测及推送方法通常仅对案件语义特征信息以及法条关联性进行学习,即只从法条本身共现关系进行建模,却忽略了法条本身的司法解释以及法条之间的相关性,导致推送结果的不全面及不准确。

技术实现思路

[0005]本申请的目的在于,提供一种法条推送方法及系统,以解决现有法条推送方法存在的推送结果不全面及不准确的技术问题。
[0006]本专利技术的第一方面公开了一种法条推送方法,包括:
[0007]获取法条司法解释集和历史诉讼案件集;
[0008]建立所述法条司法解释集与所述历史诉讼案件集的映射关系,构建多标签分类模型;
[0009]将当前诉讼案件的文本信息输入至所述多标签分类模型中,得到当前诉讼案件对应的多个法条的概率,多个法条组成备选法条集;
[0010]从所述法条司法解释集中获取与所述备选法条集中的第一法条相关的司法解释,通过司法解释集计算法条间的相似度,根据所述相似度重新确定备选法条集中各个法条的概率,当所述法条的概率≥第一阈值时,推送对应的法条。
[0011]优选地,所述建立所述法条司法解释集与所述历史诉讼案件集的映射关系,构建
多标签分类模型,具体为:
[0012]获取所述法条司法解释集对应的第一语义向量;
[0013]获取所述历史诉讼案件集对应的第二语义向量;
[0014]将所述第一语义向量和所述第二语义向量输入至卷积神经网络模型中,建立所述第一语义向量和所述第二语义向量之间的映射关系,得到多标签分类模型。
[0015]优选地,所述获取所述法条司法解释集对应的第一语义向量,具体为:
[0016]将所述法条司法解释集输入至XLNET模型中,得到所述法条司法解释集对应的第一语义向量;
[0017]所述获取所述历史诉讼案件集对应的第二语义向量,具体为:
[0018]将所述历史诉讼案件集输入至XLNET模型中,得到所述历史诉讼案件集对应的第二语义向量。
[0019]优选地,从所述法条司法解释集中获取与所述备选法条集中的第一法条相关的司法解释,通过司法解释集计算法条间的相似度,根据所述相似度重新确定备选法条集中各个法条的概率,具体为:
[0020]获取所述备选法条集中各个法条的概率,将概率≥第二阈值的法条记为第一法条;
[0021]利用余弦距离方法计算法条司法解释集中的各个司法解释的向量表示与所述第一法条的司法解释的向量表示的相似度;
[0022]根据所述相似度重新确定备选法条集中各个法条的概率。
[0023]优选地,获取所述备选法条集中各个法条的概率,具体为:
[0024]利用第一公式获取所述备选法条集中各个法条的概率,所述第一公式为:
[0025][0026]式中,x为备选法条集中一个法条的向量表示;本专利技术中的向量表示即为语义向量,即法条的向量表示为法条的语义向量,该语义向量的是通过将法条输入至XLNET模型中获取的。
[0027]利用余弦距离方法计算法条司法解释集中的各个司法解释的向量表示与所述第一法条的司法解释的向量表示的相似度,具体为:
[0028]利用第二公式计算法条司法解释集中的各个司法解释的向量表示与所述第一法条的司法解释的向量表示的相似度,所述第二公式为:
[0029][0030]式中,a为第一法条的司法解释的向量表示、b
i
为所述法条司法解释集中第i个法条的司法解释的向量表示,m为向量维度。
[0031]优选地,根据所述相似度重新确定备选法条集中各个法条的概率,具体为:
[0032]利用第三公式重新计算备选法条集中各个法条的概率,所述第三公式为:
[0033][0034]式中,p1为所述备选法条集中其中一个法条的概率,为可变参数,sim为相似度,p为重新计算后的对应法条的概率。
[0035]优选地,在所述将当前诉讼案件的文本信息输入至所述多标签分类模型中之前,还包括:
[0036]利用分布式估计算法增强所述当前诉讼案件的文本信息;
[0037]相应的,所述将当前诉讼案件的文本信息输入至所述多标签分类模型中,具体为:
[0038]将增强后的所述当前诉讼案件的文本信息输入至所述多标签分类模型中。
[0039]优选地,在所述将增强后的所述当前诉讼案件的文本信息输入至所述多标签分类模型中之后,还包括:
[0040]利用回译法扩充增强后的所述当前诉讼案件的文本信息;
[0041]相应的,所述将增强后的所述当前诉讼案件的文本信息输入至所述多标签分类模型中,具体为:
[0042]将扩充后的所述当前诉讼案件的文本信息输入至所述多标签分类模型中。
[0043]优选地,在所述获取法条司法解释集和历史诉讼案件集之后,还包括:
[0044]利用分布式估计算法增强所述历史诉讼案件集;
[0045]相应的,所述建立所述法条司法解释集与所述历史诉讼案件集的映射关系,得到多标签分类模型,具体为:
[0046]建立所述法条司法解释集和增强后的历史诉讼案件集的映射关系,得到多标签分类模型。
[0047]优选地,在建立所述法条司法解释集和和增强后的历史诉讼案件集的映射关系,得到多标签分类模型之后,还包括:
[0048]利用回译法扩充增强后的所述历史诉讼案件集;
[0049]相应的,所述建立所述法条司法解释集和增强后的历史诉讼案件集的映射关系,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种法条推送方法,其特征在于,包括:获取法条司法解释集和历史诉讼案件集;建立所述法条司法解释集与所述历史诉讼案件集的映射关系,构建多标签分类模型;将当前诉讼案件的文本信息输入至所述多标签分类模型中,得到当前诉讼案件对应的多个法条的概率,多个法条组成备选法条集;从所述法条司法解释集中获取与所述备选法条集中的第一法条相关的司法解释,通过法条司法解释集计算法条间的相似度,根据所述相似度重新确定备选法条集中各个法条的概率,当法条的概率≥第一阈值时,推送对应的法条。2.根据权利要求1所述的方法,其特征在于,所述建立所述法条司法解释集与所述历史诉讼案件集的映射关系,构建多标签分类模型,具体为:获取所述法条司法解释集对应的第一语义向量;获取所述历史诉讼案件集对应的第二语义向量;将所述第一语义向量和所述第二语义向量输入至卷积神经网络模型中,建立所述第一语义向量和所述第二语义向量之间的映射关系,构建多标签分类模型。3.根据权利要求2所述的方法,其特征在于,所述获取所述法条司法解释集对应的第一语义向量,具体为:将所述法条司法解释集输入至XLNET模型中,得到所述法条司法解释集对应的第一语义向量;所述获取所述历史诉讼案件集对应的第二语义向量,具体为:将所述历史诉讼案件集输入至XLNET模型中,得到所述历史诉讼案件集对应的第二语义向量。4.根据权利要求2或3所述的方法,其特征在于,从所述法条司法解释集中获取与所述备选法条集中的第一法条相关的司法解释,通过法条司法解释集计算法条间的相似度,根据所述相似度重新确定备选法条集中各个法条的概率,具体为:获取所述备选法条集中各个法条的概率,将概率≥第二阈值的法条记为第一法条;利用余弦距离方法计算法条司法解释集中的各个司法解释的向量表示与第一法条的司法解释的向量表示的相似度;根据所述相似度重新确定备选法条集中各个法条的概率。5.根据权利要求4所述的方法,其特征在于,获取所述备选法条集中各个法条的概率,具体为:利用第一公式获取所述备选法条集中各个法条的概率,所述第一公式为:式中,x为备选法条集中一个法条的向量表示;利用余弦距离方法计算法条司法解释集中的各个司法解释的向量表示与所述第一法条的司法解释的向量表示的相似度,具体为:利用第二公式计算法条司法解释集中的各个司法解释的向量表示与所述第一法条的司法解释的向量表示的相似度,所述第二公式为:
式中,a为第一法条的司法解释...

【专利技术属性】
技术研发人员:杨风暴王肖霞孙豫峰
申请(专利权)人:中北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1