当前位置: 首页 > 专利查询>山东大学专利>正文

基于相关性图学习的案由分类方法及系统技术方案

技术编号:29967583 阅读:15 留言:0更新日期:2021-09-08 09:38
本发明专利技术公开了基于相关性图学习的案由分类方法及系统,获取待分类的案由;对待分类的案由进行处理,获得待分类案由的特征向量;从每个已知案由分类标签对应的K个聚类中心中,随机抽取N个聚类中心,得到每个已知案由分类标签对应的N个聚类中心;基于M种已知案由分类标签对应的已抽取的M*N个聚类中心,和待分类案由的特征向量,构建构造图;将构造图,输入到训练后的图卷积神经网络中,得到待分类案由的分类结果。本发明专利技术提出使用相关性图学习的方法来使用其他案由来辅助完成当前案由的分析分类,更容易加入先验知识,适当考虑了不同案由之间的相似性与差异性,充分模拟了人类的经验系统,提高了案由分析分类的效果。提高了案由分析分类的效果。提高了案由分析分类的效果。

【技术实现步骤摘要】
基于相关性图学习的案由分类方法及系统


[0001]本专利技术涉及案由分析分类
,特别是涉及基于相关性图学习的案由分类方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]案由是指法律案件的具体内容或者具体事项,案由分析分类是指对一条案由进行分析,然后准确地得到这条案由所属的类别。如今,我国每年约产生几千万条案件,很多情况下都是靠法务工作者去对案件进行分类的,这样需要耗费巨大的人力和物力,而且分类结果往往会存在一定的误差。为了摆脱使用人工对法律案件进行分类的现状,引入了使用计算机来对法律案件进行分类的方法,使用计算机来对案由进行分类可以大大提高分类的速度和精度。因此,专利技术一种案由分析分类系统对于提高案由分类的精度和效率具有极为重要的意义。
[0004]现有的专利和发表的论文中,大家都是用自然语言处理(NLP)的方法来完成对案由的分析分类,常用的自然语言处理方法有:TextCNN、HBiGRU、HBiLSTM等。自然语言处理的方法得到的模型具有较强的学习能力,而且具有理想的分类效果,大致能够满足现实需求。
[0005]我们知道现在发生的每一条案件,很有可能之前也发生过相同或相似的案件,法务专家之所以被称为专家,是因为他们有丰富的经验,当看到一条新的案由时,能够使用自己积累的经验,快速准确地对这条新案由进行分析分类。例如:之前发生过一起盗窃类的案件,当我们再看到相似的案件描述时,我们会不由自主地想到它属于盗窃案;当我们看到一起谋杀案件的描述时,我们考虑到它完全不同于盗窃案,所以我们会排除它属于盗窃案的可能。所以其他案由的描述能够辅助我们进行当前案由的分析分类,但是现有自然语言处理的方法都是对每一条案由单独进行分析分类,并没有考虑不同案由之间的相似性与差异性,没有使用其他案由来辅助完成当前案由的分析分类,没有模拟人类的经验系统,所以分类效果较差。
[0006]近年来,大家都是用自然语言处理(NLP)的方法来完成对案由的分析分类,但是现有自然语言处理的方法都是对每一条案由单独进行分析分类,并没有考虑不同案由之间的相似性与差异性,没有使用其他案由来辅助完成当前案由的分析分类,没有模拟人类的经验系统,所以分类效果较差。因此,如何使用其他案由来辅助完成当前案由的分析分类,提高案由分析分类的效果,是目前本领域技术人员需要解决的技术问题。

技术实现思路

[0007]为了解决现有技术的不足,本专利技术提供了基于相关性图学习的案由分类方法及系统;该专利技术提出使用相关性图学习的方法来使用其他案由来辅助完成当前案由的分析分类,更容易加入先验知识,适当考虑了不同案由之间的相似性与差异性,充分模拟了人类的经验系统,提高了案由分析分类的效果。
[0008]第一方面,本专利技术提供了基于相关性图学习的案由分类方法;
[0009]基于相关性图学习的案由分类方法,包括:
[0010]获取待分类的案由;
[0011]对待分类的案由进行处理,获得待分类案由的特征向量;
[0012]从每个已知案由分类标签对应的K个聚类中心中,随机抽取N个聚类中心,得到每个已知案由分类标签对应的N个聚类中心;基于M种已知案由分类标签对应的已抽取的M*N个聚类中心,和待分类案由的特征向量,构建构造图;其中,K、M和N均为正整数;
[0013]将构造图,输入到训练后的图卷积神经网络中,得到待分类案由的分类结果。
[0014]第二方面,本专利技术提供了基于相关性图学习的案由分类系统;
[0015]基于相关性图学习的案由分类系统,包括:
[0016]获取模块,其被配置为:获取待分类的案由;
[0017]特征提取模块,其被配置为:对待分类的案由进行处理,获得待分类案由的特征向量;
[0018]构造图构建模块,其被配置为:从每个已知案由分类标签对应的K个聚类中心中,随机抽取N个聚类中心,得到每个已知案由分类标签对应的N个聚类中心;基于M种已知案由分类标签对应的已抽取的M*N个聚类中心,和待分类案由的特征向量,构建构造图;其中,K、M和N均为正整数;
[0019]分类模块,其被配置为:将构造图,输入到训练后的图卷积神经网络中,得到待分类案由的分类结果。
[0020]第三方面,本专利技术还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。
[0021]第四方面,本专利技术还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
[0022]与现有技术相比,本专利技术的有益效果是:
[0023]本专利技术提出使用相关性图学习的方法来使用其他案由来辅助完成当前案由的分析分类,更容易加入先验知识,适当考虑了不同案由之间的相似性与差异性,充分模拟了人类的经验系统,提高了案由分析分类的效果。
[0024]基于相关性图学习的模型的方法具有以下优点:(1)对于噪声具有较好的鲁棒性。(2)模型参数量,训练速度快。与基于自然语言处理的方法不同,该类模型参数量很少,训练速度快,便于部署并且可以快速实现。(3)从建模的角度来说,该类方法更容易加入先验知识。
[0025]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0026]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0027]图1为本专利技术基于相关性图学习的案由分析分类方法流程图;
[0028]图2为本专利技术中对案由进行处理,获得对应的特征向量的说明图;
[0029]图3为本专利技术获取每一类案由的聚类中心的说明图;
[0030]图4为本专利技术使用图网络对案由类别进行预测的说明图。
具体实施方式
[0031]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0032]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于相关性图学习的案由分类方法,其特征是,包括:获取待分类的案由;对待分类的案由进行处理,获得待分类案由的特征向量;从每个已知案由分类标签对应的K个聚类中心中,随机抽取N个聚类中心,得到每个已知案由分类标签对应的N个聚类中心;基于M种已知案由分类标签对应的已抽取的M*N个聚类中心,和待分类案由的特征向量,构建构造图;其中,K、M和N均为正整数;将构造图,输入到训练后的图卷积神经网络中,得到待分类案由的分类结果。2.如权利要求1所述的基于相关性图学习的案由分类方法,其特征是,对待分类的案由进行处理,获得待分类案由的特征向量;具体包括:对待分类的案由去除标点符号;将去除标点符号后的文本进行分词处理;将分词后的结果进行词频统计;将词频统计后的词汇,按照词频从大到小的顺序进行排序;按照排序后的词频,给每个单词分配一个数字ID编码;将所有数字ID编码按照词频排序的顺序进行拼接,得到待分类案由的向量;对待分类案由的向量,提取特征向量。3.如权利要求1所述的基于相关性图学习的案由分类方法,其特征是,从每个已知案由分类标签对应的K个聚类中心中,随机抽取N个聚类中心,得到每个已知案由分类标签对应的N个聚类中心;其中K个聚类中心,是通过如下步骤获取的:对每个已知案由分类标签的案由进行处理,得到每个已知案由分类标签的案由特征向量;将每类已知案由分类标签的所有案由特征向量进行聚类,得到每类已知案由分类标签的K个聚类中心。4.如权利要求3所述的基于相关性图学习的案由分类方法,其特征是,聚类采用K

means聚类;每个聚类中心都具有代表性;其中,K

means聚类是一种迭代聚类的方法,首先将所有数据预分成K组,随机取出每一组中的一个样本作为聚类中心,计算每个样本与不同聚类中心的距离,将每个样本划分到与它最近的聚类中心所在的组,然后求每一组的中心,然后使用中心点当作该组的聚类中心,重复执行上述操作,直至每一组的中心点不再发生变化。5.如权利要求1所述的基于相关性图学习的案由分类方法,其特征是,基于M种已知案由分类标签对应的已抽取的M*N个聚类中心,和待分类案由的特征向量,构建构造图;具体包括:基于M种已知案由分类标签对应的已抽取的M*N个聚类中心,将M*N个聚类中心中每个聚类中心视为图的节点,将待分类案由的特征向量也视为图的节点,计算节点与节点之间的相似度,将相似度高于设定阈值的两个节点进行连...

【专利技术属性】
技术研发人员:尹义龙侯文杰袭肖明张浩杰马明珠王子欣朱桂萍
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1