当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于深度神经网络的争议焦点识别方法技术

技术编号:30501646 阅读:20 留言:0更新日期:2021-10-27 22:34
本发明专利技术涉及一种基于深度神经网络的争议焦点识别方法,包括步骤:获取大量的裁判文书,并使用正则表达式方法对裁判文书进行初步清洗,提取其中原告诉称及被告辩称表述,由法学专家进行成对表述的争议焦点类别标注,完成争议焦点库的构建;利用争议焦点库对基于深度神经网络的模型进行句子级与段落级的训练,得到争议焦点识别器;将待识别的诉辩双方成对表述经过预处理后作为输入,传入步骤二训练得到的争议焦点识别器中,争议焦点识别器输出争议焦点所属类别。本发明专利技术方法的流程可以通过机器自动学习完成,节省人工开支;识别准确率得到提升;能更好的进行争议焦点识别,为法官、检察官及其他司法人员快速、准确分析案件的关键信息提供支持。提供支持。提供支持。

【技术实现步骤摘要】
一种基于深度神经网络的争议焦点识别方法


[0001]本专利技术涉及争议焦点识别
,特别是涉及一种基于深度神经网络的争议焦点识别方法。

技术介绍

[0002]随着智慧司法概念的提出及司法公开平台的建设,司法领域的信息化被有效推动。智慧司法主要基于自然语言处理技术(Natural Language Processing,NLP) 对司法领域数据进行处理,因为司法领域的大多数资源都以文本形式显示,例如判决文书、法律意见等,如何将NLP技术更好的应用于司法领域并使其受益逐渐得到了学业界和工业界的广泛关注。
[0003]在司法领域中存在大量高质量的文本数据,与其他领域数据相比,特点是篇幅较长,法律专业人士经常考虑如何通过基于规则和基于符号的方法解决任务,而NLP研究人员则更多地关注数据驱动和嵌入方法。为了促进司法人工智能的发展,许多研究人员做出了巨大的努力,早期研究由于当时的计算限制,始终使用手工制作的规则或功能。近年来,随着深度学习的飞速发展,研究人员开始将深度学习技术应用于司法领域。
[0004]争议焦点是指诉讼案件中,诉辩双方在证据、事实和法律适用方面的核心争议,除与个案的事实、证据等因素相关,还与案件的性质和案由具有高度的关联性,这使得特定案由案件的争议焦点具备一定的特点,而且可以被归类为有限数量的类型,从而构建争议焦点库。
[0005]争议焦点识别作为司法领域的基础任务,当前的研究一直没有实现很大突破,如何将智能化方法应用于本问题最终实现案件审理效率的提升成为一个具有重要意义的研究任务。NLP在法律领域中已经得到了应用,但在争议焦点识别方面的研究仍不充足,有待深入研究。另外诉辩材料具有独特的结构特点,对其中多类争议焦点进行识别,能进一步使司法领域信息化进程得到发展。

技术实现思路

[0006]为解决现有技术中争议焦点识别存在的不足,同时针对诉辩材料具有文本较长且长度不一,不易于模型理解深层语义的特性,本专利技术提出一种基于深度神经网络的争议焦点识别方法。本专利技术所提出的一种基于深度神经网络的争议焦点识别方法旨在通过智能化技术自动分析案件诉辩过程中的争议焦点,为法官、检察官及其他司法人员快速、准确分析案件的关键信息提供支持,实现NLP 技术在司法领域的深度应用,为解决司法业务中涉及的智能化处理与分析问题提供科学与技术支撑。
[0007]为实现上述目的,本专利技术采取如下的技术方案:
[0008]一种基于深度神经网络的争议焦点识别方法,该方法包括以下步骤:
[0009]步骤一:获取大量的裁判文书,并使用正则表达式方法对所述裁判文书进行初步清洗,提取其中原告诉称及被告辩称表述,由法学专家进行成对表述的争议焦点类别标注,
完成争议焦点库的构建;
[0010]步骤二:利用所述争议焦点库对基于深度神经网络的模型进行句子级与段落级的训练,得到争议焦点识别器;
[0011]步骤三:将待识别的诉辩双方成对表述经过预处理后作为输入,传入步骤二训练得到的所述争议焦点识别器中,所述争议焦点识别器输出所述待识别的诉辩双方成对表述的争议焦点所属类别。
[0012]与现有技术相比,本专利技术具有以下有益效果:
[0013](1)本专利技术所提出的基于深度神经网络的争议焦点识别方法的流程可以通过机器自动学习完成,节省人工开支;
[0014](2)本专利技术可以使模型更好的理解文本的深层语义,使识别准确率得到提升;
[0015](3)本专利技术所提出的基于深度神经网络的争议焦点识别方法能更好的进行争议焦点识别,为法官、检察官及其他司法人员快速、准确分析案件的关键信息提供支持。
附图说明
[0016]图1为本专利技术一种基于深度神经网络的争议焦点识别方法的总体流程图;
[0017]图2为本专利技术一种基于深度神经网络的争议焦点识别方法的模型结构图;
[0018]图3为基于BERT

CBGA的矛盾检测模型结构图;
[0019]图4为诉辩文本示例;
[0020]图5为诉辩句子对示例。
具体实施方式
[0021]下面将结合附图及较佳实施例对本专利技术的技术方案进行详细描述。
[0022]在其中一个实施例中,如图1所示,本专利技术提供一种基于深度神经网络的争议焦点识别方法,该方法包括以下步骤:
[0023]步骤一:获取大量的裁判文书,并使用正则表达式方法对裁判文书进行初步清洗,提取其中原告诉称及被告辩称表述,由法学专家进行成对表述的争议焦点类别标注,完成争议焦点库的构建。
[0024]在步骤一中,诉辩材料是诉讼过程中诉辩双方提交的材料,主要包括起诉状、答辩状、卷宗及裁判文书,由于起诉状、答辩状不宜公开的原因,在训练阶段本专利技术选择通过互联网获取大量裁判文书,并使用正则表达式方法对裁判文书进行初步清洗,提取其中原告诉称及被告辩称表述,由法学专家进行成对表述的争议焦点类别标注,完成争议焦点库的构建。
[0025]进一步地,步骤一将争议焦点所属类别表达成一个二值向量,即在该诉辩双方成对表述所属争议焦点类别的向量值为1,其他为0,该二值向量作为该诉辩双方成对表述的标签向量,从而将诉辩材料中的争议焦点自动识别问题转化为多标签分类的文本匹配问题。
[0026]步骤二:利用争议焦点库对基于深度神经网络的模型进行句子级与段落级的训练,得到争议焦点识别器。
[0027]本步骤利用步骤一得到的争议焦点库对基于深度神经网络的模型结合句子级与
段落级的语义信息进行训练,得到相应的争议焦点识别器并导出。
[0028]进一步地,如图2所示,基于深度神经网络的模型同时进行句子级与段落级的训练,在句子级进行矛盾检测与分类,在段落级进行矛盾分类,基于深度神经网络的模型主要由输入层、模型层、修正层、输出层四个部分组成,步骤二具体包括以下步骤:
[0029]步骤二一:模型的输入层接受文本预处理后的诉方文本L(Xsc)、辩方文本 L(Xbc)、诉辩文本匹配后得到的诉方句子Xsc
i
(i=1,...,m)、辩方句子Xbc
j
(j=1,...,n) 作为输入,并将其转换为易于模型理解的张量,用以模型层计算句子级的特征表示与段落级的特征表示,其中句子级的特征表示包括原告诉称句子局部特征表示、原告诉称句子上下文特征表示、原告诉称句子、被告辩称句子的成对嵌入、被告辩称句子局部特征表示和被告辩称句子上下文特征表示,段落级的特征表示包括原告诉称段落特征表示和被告辩称段落特征表示。
[0030]步骤二二:在模型层,采用基于BERT

CBGA的矛盾检测模型进行矛盾检测,用于计算矛盾检测特征表示,矛盾检测特征表示包括句子级矛盾检测特征表示。采用一个具有卷积结构的模型进行矛盾分类,用于计算矛盾分类特征表示,矛盾分类特征表示包括句子级矛盾分类特征表示和段落级矛盾分类特征表示,在模型层的嵌入阶段接受诉方文本、辩方文本、诉辩文本匹配后得到的诉方句子和辩方句子输入张量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的争议焦点识别方法,其特征在于,包括以下步骤:步骤一:获取大量的裁判文书,并使用正则表达式方法对所述裁判文书进行初步清洗,提取其中原告诉称及被告辩称表述,由法学专家进行成对表述的争议焦点类别标注,完成争议焦点库的构建;步骤二:利用所述争议焦点库对基于深度神经网络的模型进行句子级与段落级的训练,得到争议焦点识别器;步骤三:将待识别的诉辩双方成对表述经过预处理后作为输入,传入步骤二训练得到的所述争议焦点识别器中,所述争议焦点识别器输出所述待识别的诉辩双方成对表述的争议焦点所属类别。2.根据权利要求1所述的一种基于深度神经网络的争议焦点识别方法,其特征在于,利用二值向量对所述争议焦点类别进行表示,所述二值向量作为诉辩双方成对表述的标签向量。3.根据权利要求1或2所述的一种基于深度神经网络的争议焦点识别方法,其特征在于,基于深度神经网络的模型包括输入层、模型层、修正层和输出层,所述步骤二包括以下步骤:步骤二一:输入层以文本预处理后的诉方文本、辩方文本、诉辩文本匹配后得到的诉方句子和辩方句子作为输入文本,并将其转换为易于模型理解的张量,输入至模型层的嵌入层,用于模型层计算句子级的特征表示与段落级的特征表示;步骤二二:在模型层,接受诉方文本、辩方文本、诉辩文本匹配后得到的诉方句子和辩方句子输入张量,并计算句子级的特征表示与段落级的特征表示后,进一步采用基于BERT

CBGA的矛盾检测模型进行矛盾检测,用于计算矛盾检测特征表示,所述矛盾检测特征表示包括句子级矛盾检测特征表示;采用具有卷积结构的模型进行矛盾分类,用于计算矛盾分类特征表示,所述矛盾分类特征表示包括句子级矛盾分类特征表示和段落级矛盾分类特征表示;在句子级别进行矛盾检测与分类,对通过诉辩文本匹配后得到的诉辩句子对输入张量进行矛盾检测,得到诉辩句子对是否存在矛盾的向量,进行矛盾分类...

【专利技术属性】
技术研发人员:白天徐明蔚蔡立东刘思铭郭书宇张佶安周航
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1