一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置制造方法及图纸

技术编号:23085847 阅读:31 留言:0更新日期:2020-01-11 01:25
本发明专利技术公开一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置。本发明专利技术提出了基于多方证据关联模型和神经网络的诉讼请求合理性预测框架,首先基于诉讼请求的司法知识和多方证据关联模型设计了诉讼请求合理性的司法特征,然后基于深度神经网络模型对司法特征进行训练预测,最终实现了对诉讼求情合理性的预测和评估方案。本发明专利技术能够进行有效的、准确的诉讼请求合理性预测,从而提示当事人及时合理地规避风险、理性诉讼,同时支持诉前引导、案件分流,也可以为法官进行智能风险提示,辅助断案。

【技术实现步骤摘要】
一种基于神经网络的诉讼请求合理性预测模型训练方法和预测方法及装置
本专利技术属于人工智能以及司法大数据领域,具体涉及一种基于神经网络的诉讼请求合理性预测模型训练方法和诉讼请求合理性预测方法及装置。
技术介绍
随着智慧法院建设的推进,人工智能技术在诉讼风险分析中凸显出越来越重大的意义。以司法场景专用大数据与人工智能技术为驱动,对诉讼请求合理性等风险进行提醒,是构建诉讼风险分析和结果预测平台的重要模块,不仅能够有效节约法院诉讼服务人力、空间资源,同时还能够为公众随时提供简单、安全、智慧、高效的诉讼智能服务,从而在诉讼准备阶段提供全面的诉讼决策指引、合理分流不必要的诉讼请求,大力提升公众对法院诉讼服务的满意度,提高法院公信力。诉讼合理性的预测是诉讼风险分析的重要组成部分,在诉讼风险分析研究方面,国内常规采用定性与定量结合分析。其中,风险评估定性方法是采用文字描述和定义级别,说明风险程度和风险出现可能性,包括但不限于问卷调查、集体讨论以及专家调查法,其优势在于可以更高效快速的评估风险。风险评估定量方法是使用多源数据分析风险程度和可能性,主要包括决策树分析法、蒙特卡罗模拟方法、敏感性分析等。其中,决策树法是比较常用的定量分析方法,其利用图解形式,将风险因素层层分解,绘制成树状图,逐项计算其概率和期望值,其计算量与风险因素、变化频度成指数关系,需要足够有效数据支撑,该方法层次清晰,不同对象的风险及概率一目了然,不易遗漏,能够适应多阶段风险分析。蒙特卡罗模拟方法是一种随机模拟数学方法,用于分析评估风险发生可能性、风险的成因、风险造成的损失或带来的机会等变量在未来变化的概率分布,具有效力高、结果相对精确的优点。目前针对中国法律法规的诉讼请求合理性预测准确率不高,缺乏针对异构、多样的案件进行合理化预期建模的方法;同时,基于机器学习方法对于诉讼请求合理性判断的研究较少,诉讼请求合理性的特征设计、选择和模型仍待探索。对诉讼合理性的预测既依赖于法律法规,又依赖于案件证据和事实的判定。诉讼请求合理性的关键特征以及选择是一个有待探索的问题,同时,面对诉讼活动复杂性、专业性以及法律局限性和证据不确定性等挑战,传统的浅层模型难以应对诉讼合理性预测的挑战。近年来,随着计算能力的提升,基于海量参数训练的深度神经网络模型逐渐在各个领域大放异彩。在语音识别、图像识别和机器翻译等领域取得了巨大成就,例如AlexNet、VGG-Net、R-CNN和ResNet等。神经网络模型可以有效应对诉讼请求合理性预测的复杂性,因此,本专利技术提出了基于神经网络进行诉讼请求合理性预测的方法。
技术实现思路
本专利技术的目的在于提供一种基于神经网络的诉讼请求合理性预测模型训练方法和诉讼请求合理性预测方法及装置,能够进行有效的、准确的诉讼请求合理性预测,从而提示当事人及时合理地规避风险、理性诉讼,同时支持诉前引导、案件分流。本专利技术通过如下技术方案来解决问题:构建诉讼风险规则知识库:对法律法规、案件事实、裁判文书等进行无监督机器学习,对潜在风险点进行分类,形成诉讼风险规则知识库。诉讼特征量化:依托多方证据关联模型及诉讼风险规则知识库中诉讼请求合理性相关的风险规则,围绕争议焦点、权利要求、要件事实、证据条件和诉讼请求确定诉讼特征;最终获得诉讼风险对诉讼请求合理性的诉讼特征量化方法。诉讼请求合理性模型训练:基于历史案件样本,对训练数据进行特征量化,训练预测诉讼请求合理性的神经网络模型。诉讼请求合理性预测:基于上一步训练的预测模型,对当前诉讼案件进行特征量化,输入神经网络模型,预测诉讼请求合理性。具体来说,本专利技术采用的技术方案如下:第一方面,本专利技术提供一种基于神经网络的诉讼请求合理性预测模型训练方法,包括以下步骤:根据法律法规及相关文书,构建诉讼风险规则知识库;构建多方证据关联模型,根据多方证据关联模型提取训练数据中用于预测诉讼请求合理性的诉讼特征;根据诉讼风险知识规则库和相关证据条件可信评估概率对提取的诉讼特征进行量化;采用量化后的训练数据训练用于预测诉讼请求合理性的深度神经网络模型。进一步地,所述构建诉讼风险规则知识库,包括:基于中国三部诉讼法、九部审判法、裁判文书、电子卷宗等,构建学习样本,形成样本数据库;对样本数据库进行分句,然后进行证据规范法条识别;通过Bootstrapping方法进行样本采样;采用多分类器投票的算法进行风险规则和数据关系的高效抽取,形成诉讼风险规则知识库。进一步地,所述构建多方证据关联模型,包括:基于历史案例样本,确定不同类型案件的事实判定链;根据不同来源的证据抽取证据要素;对证据要素进行归类推理,根据证据要素之间的关联关系,计算证据之间的相关概率;根据事实判定链将证据进行关联,并结合证据之间的相关概率,采用贝叶斯网络构建多方证据关联网络模型,其中每个节点表示一个证据,边的权重表示证据之间的相关概率。进一步地,所述根据不同来源的证据抽取证据要素,包括:建立证据要素模板;通过自然语言抽取技术从不同来源的证据中抽取出文本数据信息;将抽取的文本数据信息与所述证据要素模板中的相应内容进行匹配,利用程序自动化地抽取证据要素。进一步地,所述相关证据条件可信评估概率的计算方式为:基于具备多方证据和证据转移概率的多方证据关联模型,利用遗传算法进行推理,计算出全部证据链条的概率值,即为相关证据条件可信评估概率。进一步地,所述深度神经网络模型的训练过程包括:对历史诉讼案件中包括电子卷宗、电子证据和起诉书在内的诉讼相关材料进行预处理,根据历史诉讼案件中的裁决结果对诉讼请求是否支持,整理出诉讼请求“合理”和“不合理”两类正负训练卷宗;对正负训练卷宗提取诉讼特征,并对提取的诉讼特征进行量化;搭建基于多层感知机的神经网络模型,用诉讼特征向量和正负标注训练神经网络模型,使其具备诉讼请求合理性的能力。第二方面,本专利技术提供一种基于神经网络的诉讼请求合理性预测模型训练装置,其包括:知识库构建模块,负责根据法律法规及相关文书,构建诉讼风险规则知识库;模型构建及特征提取模块,负责构建多方证据关联模型,根据多方证据关联模型提取训练数据中用于预测诉讼请求合理性的诉讼特征;特征量化模块,负责根据诉讼风险知识规则库和相关证据条件可信评估概率对提取的诉讼特征进行量化;训练模块,负责采用量化后的训练数据训练用于预测诉讼请求合理性的深度神经网络模型。第三方面,本专利技术提供一种基于神经网络的诉讼请求合理性预测方法,包括以下步骤:对待预测的案件的材料进行特征提取和量化;将量化后的数据输入采用上面所述方法训练完成的诉讼请求合理性预测模型,并输出诉讼请求合理性预测结果。进一步地,所述诉讼请求合理性预测结果,包括诉讼有效性和诉讼合理性是否有效以及有效概率的预测结果。第四方面,本专利技术提供一种基于神经网络的诉讼本文档来自技高网
...

【技术保护点】
1.一种基于神经网络的诉讼请求合理性预测模型训练方法,其特征在于,包括以下步骤:/n根据法律法规及相关文书,构建诉讼风险规则知识库;/n构建多方证据关联模型,根据多方证据关联模型提取训练数据中用于预测诉讼请求合理性的诉讼特征;/n根据诉讼风险知识规则库和相关证据条件可信评估概率对提取的诉讼特征进行量化;/n采用量化后的训练数据训练用于预测诉讼请求合理性的深度神经网络模型。/n

【技术特征摘要】
1.一种基于神经网络的诉讼请求合理性预测模型训练方法,其特征在于,包括以下步骤:
根据法律法规及相关文书,构建诉讼风险规则知识库;
构建多方证据关联模型,根据多方证据关联模型提取训练数据中用于预测诉讼请求合理性的诉讼特征;
根据诉讼风险知识规则库和相关证据条件可信评估概率对提取的诉讼特征进行量化;
采用量化后的训练数据训练用于预测诉讼请求合理性的深度神经网络模型。


2.根据权利要求1所述的方法,其特征在于,所述构建诉讼风险规则知识库,包括:
基于中国三部诉讼法、九部审判法、裁判文书、电子卷宗等,构建学习样本,形成样本数据库;
对样本数据库进行分句,然后进行证据规范法条识别;
通过Bootstrapping方法进行样本采样;
采用多分类器投票的算法进行风险规则和数据关系的高效抽取,形成诉讼风险规则知识库。


3.根据权利要求1所述的方法,其特征在于,所述构建多方证据关联模型,包括:
基于历史案例样本,确定不同类型案件的事实判定链;
根据不同来源的证据抽取证据要素;
对证据要素进行归类推理,根据证据要素之间的关联关系,计算证据之间的相关概率;
根据事实判定链将证据进行关联,并结合证据之间的相关概率,采用贝叶斯网络构建多方证据关联网络模型,其中每个节点表示一个证据,边的权重表示证据之间的相关概率。


4.根据权利要求3所述的方法,其特征在于,所述根据不同来源的证据抽取证据要素,包括:
建立证据要素模板;
通过自然语言抽取技术从不同来源的证据中抽取出文本数据信息;
将抽取的文本数据信息与所述证据要素模板中的相应内容进行匹配,利用程序自动化地抽取证据要素。


5.根据权利要求1所述的方法,其特征在于,所述相关证据条件可信评估概率的计算方式为:基于具备多方证据和证据转移概率的多方证据关联模型,利用遗传算法...

【专利技术属性】
技术研发人员:程慧芳杨东昊崔桐吴正午于婧悦毛小龙
申请(专利权)人:中国司法大数据研究院有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1