一种审判风险智能识别与预警方法、系统、介质及设备技术方案

技术编号:24459541 阅读:77 留言:0更新日期:2020-06-10 16:34
本公开提供了一种审判风险智能识别与预警方法,获取案件要素并计算案件要素特征向量;将得到的案件要素特征向量输入训练好的多标记分类模型中,得到案件可能发生的风险类别集合;根据案件可能发生的风险类别集合,计算案件预警指数,根据预警指数的数值,选择预设的对应预警方式和预警对象进行预警;本公开能够自动识别审判过程中多个阶段和多种类别的复杂风险点,解决了目前复杂审判风险识别仍依赖于人工分析和评估的缺陷;同时实现了对审判风险的分类和分级智能化预警,能够帮助法院高效地对风险做出响应以降低风险危害。

An intelligent identification and early warning method, system, medium and equipment of trial risk

【技术实现步骤摘要】
一种审判风险智能识别与预警方法、系统、介质及设备
本公开涉及审判风险预警
,特别涉及一种审判风险智能识别与预警方法、系统、介质及设备。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
,并不必然构成现有技术。随着我国全面依法治国的不断深入推进,法院审判工作的重要性愈加突出。目前,我国法院审判工作存在量大、面广、线长、点多的特点,法院面临着严重的案多人少的矛盾。在这种情况下,面对案情复杂的诉讼案件,审判工作中难免会出现一些疏漏。这些疏漏是引发社会舆情和信访事件的风险点,一旦引发舆情和信访事件,给法官和法院带来一系列负面影响,导致法院公信力的降低。因此,各级法院迫切需要建立有效的案件审判风险识别与预警系统,从而能够及早发现、及时预防、有效处置各类审判风险。本公开专利技术人发现,目前各级法院大都建设有立案管理系统、案件管理系统、审判管理系统、执行系统等业务系统,已经实现了审判业务的高度信息化。然而,在审判风险的防控方面,现有的业务信息系统尚不具备有效的风险识别和预警功能,具体体现在:首先,能够识别的审判风险类别单一,只能够对审限超时这一类风险进行提示或预警,而对于更加复杂的风险点,通常需要人工分析和评估,缺乏智能化的风险识别和预警工具;其次,识别方法简单,一般仅通过人工设定的简单规则来识别审限超时风险;第三,缺乏智能化的风险预警方式,未实现对审判风险的分类和分级预警。有鉴于上述不足,有必要提出一种覆盖面更广的、更为有效、更加智能的审判风险预警方案。
技术实现思路
为了解决现有技术的不足,本公开提供了一种审判风险智能识别与预警方法、系统、介质及设备,能够自动识别审判过程中多个阶段和多种类别的复杂风险点,解决了目前复杂审判风险识别仍依赖于人工分析和评估的缺陷;同时实现了对审判风险的分类和分级智能化预警,能够帮助法院高效地对风险做出响应以降低风险危害。为了实现上述目的,本公开采用如下技术方案:本公开第一方面提供了一种审判风险智能识别与预警方法。一种审判风险智能识别与预警方法,包括以下步骤:获取案件要素并计算案件要素特征向量;将得到的案件要素特征向量输入训练好的多标记分类模型中,得到案件可能发生的风险类别集合;根据案件可能发生的风险类别集合,计算案件预警指数,根据预警指数的数值,选择预设的对应预警方式和预警对象进行预警。作为可能的一些实现方式,多标记分类模型的训练方法,具体为:以目标法院的名称为主题词设置主题爬虫,通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息;采用情感分析算法对已爬取的每一条信息进行情感分析,得到舆情信息中的负向情感;在获取的负向情感中提取命名实体,以提取的命名实体为关键词,在法院业务系统数据库中检索相关的案件数据,如果存在与关键字匹配的案件,则视该案件审判流程中存在风险;如不存在匹配案件,则视舆情与审判流程风险无关;在法院信访系统中,提取与信访事件关联的案件编号;以案件编号为关键字,在法院业务系统中检索对应案件数据;在基于负向舆情信息和信访事件检索出的风险案件中,提取案件要素,形成风险案件的特征向量,对风险案件进行分类;随机选择一部分无风险案件并提取这些案件的案件要素,形成特征向量,风险案件集合和无风险案件集合共同构成审判风险预测模型的训练数据集;采用训练数据集训练多标记分类模型。作为进一步的限定,预警接收端在收到审判风险预警后,对风险预测的正确性和预警的合理性进行反馈,根据反馈结果调整预警策略,并将预警接收端标记为预测正确的案件加入训练集作为新的训练数据。作为进一步的限定,通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息,具体为:步骤301设定一个入口URL集合来指明信息采集的起始点;步骤302将入口URL集合加入到爬虫的待采集链接列表;步骤303判断待采集链接表是否为空,如果不为空,执行步骤304,否则返回步骤301;步骤304从待采集链接列表取出队首的链接进行采集;步骤305对采集的页面进行解析,获取页面中的主题文本和URL链接;步骤306判断主题文本中是否包含设定的主题词,如果包含,执行步骤306,否则舍弃并返回步骤301;步骤307将主题文本存入信息库;步骤308通过正则表达式判断页面中的URL链接是否是需要进一步采集的页面链接,如果是,执行步骤309;步骤309将链接加入待采集链接列表的队尾;循环执行步骤303至步骤309直至链接库为空;作为进一步的限定,采用情感分析算法对已爬取的每一条信息进行情感分析,具体为:构造情感分析训练数据集,包括正向情感集合、负向情感集合和中性情感集合,每个集合包含多条文本;构建文本内容的向量表示模型,在经向量表示后的训练数据集上训练机器学习模型得到情感分类模型;将采集的舆情信息的向量表示输入情感分类模型到其情感类别。作为进一步的限定,在获取的负向情感中提取命名实体,具体为:定义提取的命名实体集合和语义角色词汇集合,以及语义角色词汇在法院业务系统数据库表中的对应字段;在命名实体识别模型定位命名实体在文本中的位置后,搜索命名实体的前向文本和后向文本中离其最近的语义角色词汇,以最近的语义角色词汇作为命名实体的角色类别。作为更进一步的限定,对命名实体集合中的所有命名实体,采用如下步骤实现相关案例数据的检索:步骤501初始化条件列表为空;步骤502在命名实体集合中选取一个命名实体加入条件队列作为当前条件,并将该命名实体从命名实体集合中删除;步骤503采用条件队列中的所有条件的合取在法院业务数据库中采用SQL语句检索;步骤504如果返回不为空且命名实体集合不为空,则返回步骤502执行;如果返回为空且命名实体集合不为空,则执行步骤505;步骤505从条件队列中删除当前条件命名实体集合并返回步骤502继续执行;重复步骤502至505直至命名实体集合为空,以此时条件队列中的所有条件的合取为检索条件进行检索,如返回结果不为空,则得到与舆情信息最大匹配的案件数据;如返回结果为空,则视为不存在匹配案件,舆情与审判流程风险无关。作为可能的一些实现方式,根据案件要素的类型不同,采用不同的方法对其进行数值化,具体为:对于数值型的案件要素,以要素的原始数值作为对应特征的特征值;对于二值型的案件要素,如果该要素值为“是”,则其对应特征值为1;否则,对应特征值取0;对于多选项型要素,将各个选项进行编号,构建多维向量,且多维向量中只能有一个取值为1,其他均为0。本公开第二方面提供了一种审判风险智能识别与预警系统。一种审判风险智能识别与预警系统,其特征在于,包括:审判风险识别模块,被配置为:从法院业务系统接收到达的新立案案件数据,采用训练好的风险预测模型预测可能发生的风险类别集合,将预测结果发送至审判风险预警模块本文档来自技高网...

【技术保护点】
1.一种审判风险智能识别与预警方法,其特征在于,包括以下步骤:/n获取案件要素并计算案件要素特征向量;/n将得到的案件要素特征向量输入训练好的多标记分类模型中,得到案件可能发生的风险类别集合;/n根据案件可能发生的风险类别集合,计算案件预警指数,根据预警指数的数值,选择预设的对应预警方式和预警对象进行预警。/n

【技术特征摘要】
1.一种审判风险智能识别与预警方法,其特征在于,包括以下步骤:
获取案件要素并计算案件要素特征向量;
将得到的案件要素特征向量输入训练好的多标记分类模型中,得到案件可能发生的风险类别集合;
根据案件可能发生的风险类别集合,计算案件预警指数,根据预警指数的数值,选择预设的对应预警方式和预警对象进行预警。


2.如权利要求1所述的审判风险智能识别与预警方法,其特征在于,多标记分类模型的训练方法,具体为:
以目标法院的名称为主题词设置主题爬虫,通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息;
采用情感分析算法对已爬取的每一条信息进行情感分析,得到舆情信息中的负向情感;
在获取的负向情感中提取命名实体,以提取的命名实体为关键词,在法院业务系统数据库中检索相关的案件数据,如果存在与关键字匹配的案件,则视该案件审判流程中存在风险;如不存在匹配案件,则视舆情与审判流程风险无关;
在法院信访系统中,提取与信访事件关联的案件编号;以案件编号为关键字,在法院业务系统中检索对应案件数据;
在基于负向舆情信息和信访事件检索出的风险案件中,提取案件要素,形成风险案件的特征向量,对风险案件进行分类;
随机选择一部分无风险案件并提取这些案件的案件要素,形成特征向量,风险案件集合和无风险案件集合共同构成审判风险预测模型的训练数据集;
采用训练数据集训练多标记分类模型。


3.如权利要求2所述的审判风险智能识别与预警方法,其特征在于,预警接收端在收到审判风险预警后,对风险预测的正确性和预警的合理性进行反馈,根据反馈结果调整预警策略,并将预警接收端标记为预测正确的案件加入训练集作为新的训练数据;
或者,
通过运行主题爬虫在互联网上收集与目标法院相关的舆情信息,具体为:
步骤301设定一个入口URL集合来指明信息采集的起始点;
步骤302将入口URL集合加入到爬虫的待采集链接列表;
步骤303判断待采集链接表是否为空,如果不为空,执行步骤304,否则返回步骤301;
步骤304从待采集链接列表取出队首的链接进行采集;
步骤305对采集的页面进行解析,获取页面中的主题文本和URL链接;
步骤306判断主题文本中是否包含设定的主题词,如果包含,执行步骤306,否则舍弃并返回步骤301;
步骤307将主题文本存入信息库;
步骤308通过正则表达式判断页面中的URL链接是否是需要进一步采集的页面链接,如果是,执行步骤309;
步骤309将链接加入待采集链接列表的队尾;
循环执行步骤303至步骤309直至链接库为空;
或者,
采用情感分析算法对已爬取的每一条信息进行情感分析,具体为:
构造情感分析训练数据集,包括正向情感集合、负向情感集合和中性情感集合,每个集合包含多条文本;
构建文本内容的向量表示模型,在经向量表示后的训练数据集上训练机器学习模型得到情感分类模型;
将采集的舆情信息的向量表示输入情感分类模型到其情感类别。


4.如权利要求2所述的审判风险智能识别与预警方法,其特征在于,在获取的负向情感中提取命名实体,具体为:
定义提取的命名实体集合和语义角色词汇集合,以及语义角色词汇在法院业务系统数据库表中的对应字段;
在命名实体识别模型定位命名实体在...

【专利技术属性】
技术研发人员:韩晓晖尹义龙崔超然孟庆钢陆忠一王连海徐淑奖
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1