一种基于遗传算法与最近邻算法的案件检索方法技术

技术编号:16038134 阅读:187 留言:0更新日期:2017-08-19 19:57
本发明专利技术公开一种基于遗传算法与最近邻算法的案件检索方法包括以下步骤:步骤S1、将刑事案例数据科学有效地以向量形式表述并存储;步骤S2、使用基于GA‑KNN方法算法建立的模型进行推理;步骤S3、通过海量刑事案例数据的增删改查模块,为用户存取数据提供操作接口;步骤S4、利用神经网络进行建模,预测出法官判决的结果。本发明专利技术将基于证据和案例的推理系统应用到案件审理过程中,可以有效保障案件审理的客观性;同时辅助决策系统可以有效保障案件审理的公平,提高审案效率,具有理论创新和应用创新的价值。

【技术实现步骤摘要】
一种基于遗传算法与最近邻算法的案件检索方法
本专利技术涉及信息检索
,尤其涉及一种基于遗传算法与最近邻算法的案件检索方法。
技术介绍
法院作为案件审理的主体,在多年的工作中已经积累了大量丰富的成功经验,并以数字化的形式保存了大量案件情报信息。同时,随着计算机技术应用的逐步深入,对这些信息的管理和应用策略也日渐成熟,特别是在各种管理信息系统投入应用后,对案件情报信息的应用力度和管理能力已经大大提高。在历史案件信息的综合挖掘利用方面,部分发达国家早在上世纪80年代后期就开始了研究。他们依靠其先进的计算机技术的发展,利用计算机系统强大的数据处理与数据分析能力,把案件处理工作中获取的各类信息进行统一而规范的管理,以人工智能(如机器学习、人工神经网络、决策树、案例推理等)的方法进行数据的综合挖掘与综合利用,从而得出相对可靠的、具有预警功能的情报信息或方案建议,以利于决策并指导行动。具有代表性的有英国情报核心分析系统(ICAS)、美国比较数据系统(COMPSTAT)、加拿大自动化犯罪情报信息系统(ACIIS)、澳大利亚执法情报网络(ALEIN)以及我国香港的警队刑事情报信息系统(FCIS)等。我国司法部门从上个世纪90年代后期开始跟踪有关技术的发展,经过几年的积累,目前已经对本课题的基本研究方向有了一定的认识。当前,全国公安系统正在深入开展的“金盾工程”和公安信息化建设的逐步深入,给我们提供了十分难得的发展机遇。人们已经逐渐认识到了数据的重要价值,并努力建设相应的应用系统来发挥数据的巨大效力。有关部门在此基础上提出了打造“案侦信息化”的发展思路。通过引入信息化的思想,把常规的案件侦察流程信息化,融入信息化,应用信息化来辅助办案。刑侦部门在这方面的探索与发展已处于国内公安领域的前列,陆续建设了“刑事案件串并案系统”、“XX数据专家分析系统”、“公安指挥决策支持系统”等综合分析挖掘系统。但是,在综合利用数据挖掘和案例推理技术来辅助案件侦察的研究方面还十分欠缺,目前还没有开发出成功的系统,很多冠以“XX挖掘”的系统,仅仅是传统的查询、统计方法的综合运用罢了。并且,公安各警种相互间由于竞争而存在严重的技术壁垒,高新技术的产品及应用系统往往对其他警种实施技术封锁,使得各警种在新技术应用水平上参差不齐,在一定程度上也阻碍了先进技术在公安案侦领域的应用。另一方面,人们虽然逐渐习惯了案件情报数字化的使用方式,而且也产生了明显的实际效果。但是,法院对这些数据的应用还仅仅停留在简单的查询、统计、数据交换上,无法提供深层次的辅助决策支持服务。各部门在建设信息化应用系统时,一开始对于系统的长期目标规划一般就是满足信息的常规应用,信息采集入库往往是重点,缺乏深层次的综合分析利用的规划。而随着时代发展,各类民事和刑事案件也是复杂纷繁,案件审理活动由人力密集型方式向信息密集型方式演进,信息对案件审理的导向作用越来越明显。这些历史数据是大量的细节数据,提供了大量的事实和过程描述,缺乏深入的综合分析与挖掘利用实在可惜。因此为了发挥这些海量数据的价值,必须借助案例推理系统及大数据分析等相关技术。
技术实现思路
本专利技术要解决的技术问题是,提供一种基于遗传算法与最近邻算法的案件检索方法。为实现上述目的,本专利技术采用如下的技术方案:一种基于遗传算法与最近邻算法的案件检索方法包括以下步骤:步骤S1、将刑事案例数据科学有效地以向量形式表述并存储;步骤S2、使用基于GA-KNN方法算法建立的模型进行推理;步骤S3、通过海量刑事案例数据的增删改查模块,为用户存取数据提供操作接口;步骤S4、利用神经网络进行建模,预测出法官判决的结果。作为优选,步骤S1具体包括:在经过预处理后产生可供机器学习使用的向量化的数据;在每次计算参数以及检索相似案例时被多次读取向量形式的数据。作为优选,步骤S2具体包括:初始化权重种群,及产生大量的与刑事案例属性对应的权重;使用改进的相似算法从案例库中搜索出相似案例,即在测试数据库中寻找相似案例,进行推理时检索算法采用最常用的K-NN邻近算法;为每个染色体计算适应性函数,并进行遗传算法的进化操作;根据适应性函数的具体函数值评估结果。作为优选,步骤S3具体包括:对法律文书等资料的批量增加、对法律文书等资料的批量删除、对录入有误数据的修改以及对特定相关案例的查询;海量数据的增删改查技术必须确保对用户操作及函数调用的及时响应;确保数据在储存、读取及修改时的可靠性。作为优选,步骤S4具体包括:根据以往的案例训练神经网络,对案例判决过程建立起模型;将待检检索案例输入到神经网络后能够输出对判决的预测结果。本专利技术具有以下特点:(1)目前有诸多关于案件推理相关研究,但是以大数据管理和分析为基础的案件推理系统还鲜有研究和讨论,本专利技术研究基于遗传算法与最近邻算法的案件的智能分析及推理,研究内容具有新颖性。(2)本专利技术从案件的向量及过往因循案例出发,实现案件智能分析及证据关联,有助于减轻法官的工作量,研究具有工程前瞻性。(3)考虑到案件审理的具有一定的主观性,同时当前对案件的处理依然不能摆脱人工密集型的特点,本专利技术将基于遗传算法与最近邻算法的推理系统应用到案件审理过程中,可以有效保障案件审理的客观性;同时辅助决策系统可以有效保障案件审理的公平,提高审案效率,具有理论创新和应用创新的价值。附图说明图1为本专利技术的基于遗传算法与最近邻算法的案件检索方法的流程示意图。具体实施方式将案例的特征与法律领域本体案例库中的本体信息进行比较、匹配,通过本体解析,在法律条例本体案例库中找到与案例的特征相似的相关法条,并提取法条及相关审判推荐,整体架构如图1所示。以法院案件审理过程中重要的证据及因循案例海量数据为基础的刑事案件和民事案件判决书文档集。把这些文档存储于本地或网络的数据库或根目录下的子文件夹下。对刑事案例进行建模,归纳案例特征:共计39类案例特征,涵盖了犯罪行为的起因、经过、事后行为3方面语义。根据刑事属性的专家解析,我们拟将案例属性确定为这39个指标。将每个具体案例中的关键词抽取出来,并用标量来描述每个属性。将所判刑罚类型归纳为如下7类:E1:三年以下有期徒刑E5:十年以上有期徒刑E2:三年以下拘役E6:无期徒刑E3:三年以下管制E7:死刑E4:三年以上十年以下有期徒刑将事件起因可能的特征值总结如表1所示,表中第一行为一级特征;第二行为对一级特征的特征值的进一步分类,使在表述某一案例时,各二级特征有且只有一个特征值;第三行为各类中可能的特征值;规范特征值的目的是为了便于使用决策树、神经网络等数据挖掘算法,为各非二值特征属性的特征值赋予符号标识(如表中的A1至A9),二值特征属性的特征值规范为0或1。表一将先施暴方可能的特征值总结如表2所示;表二将施暴方式可能的特征值总结如表3所示;表三在总结作案工具的特征值时,对多个可能的特征值进行归纳总结,总结为如表4所示的若干二级特征值,及其规范化后的特征值。特别地,在实际案例中,有混合使用多种作案工具的情况。表四将袭击部位可能的特征值总结如表5所示;表五最后,将这些标量组成描述该法律案例的一个语义向量:手工进行提取案例特征并进行以案例特征单值化为目的的预处理,即根据专家经验判断案件是否满足表1到表5描述的特征。如果满足某本文档来自技高网
...
一种基于遗传算法与最近邻算法的案件检索方法

【技术保护点】
一种基于遗传算法与最近邻算法的案件检索方法,其特征在于,包括以下步骤:步骤S1、将刑事案例数据科学有效地以向量形式表述并存储;步骤S2、使用基于GA‑KNN方法算法建立的模型进行推理;步骤S3、通过海量刑事案例数据的增删改查模块,为用户存取数据提供操作接口;步骤S4、利用神经网络进行建模,预测出法官判决的结果。

【技术特征摘要】
1.一种基于遗传算法与最近邻算法的案件检索方法,其特征在于,包括以下步骤:步骤S1、将刑事案例数据科学有效地以向量形式表述并存储;步骤S2、使用基于GA-KNN方法算法建立的模型进行推理;步骤S3、通过海量刑事案例数据的增删改查模块,为用户存取数据提供操作接口;步骤S4、利用神经网络进行建模,预测出法官判决的结果。2.根据权利要求1所述的基于遗传算法与最近邻算法的案件检索系统,其特征在于,步骤S1具体包括:在经过预处理后产生可供机器学习使用的向量化的数据;在每次计算参数以及检索相似案例时被多次读取向量形式的数据。3.根据权利要求1所述的基于遗传算法与最近邻算法的案件检索系统,其特征在于,步骤S2具体包括:初始化权重种群,及产生大量的与刑事案例属性对应的权重;使用改进的相似算法从案...

【专利技术属性】
技术研发人员:佘贵清王萌公备宋永利李东海肖创柏
申请(专利权)人:北京市高级人民法院北京工业大学北京华宇信息技术有限公司
类型:发明
国别省市:北京,11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1