当前位置: 首页 > 专利查询>贵州大学专利>正文

一种面向涉毒案件的犯罪行为序列可视化方法及系统技术方案

技术编号:36082479 阅读:11 留言:0更新日期:2022-12-24 10:56
本发明专利技术提出了一种面向涉毒案件的犯罪行为序列可视化方法;首先使用涉毒案件案情部分生成预训练词向量,根据序列节点词向量相似度构建行为词的树结构;再根据行为词的树结构对犯罪行为序列中节点进行合并;挖掘出序列模式,根据序列模式对所有序列划分成簇,将序列表示成序列模式和序列补充;最后提取出序列模式中的焦点进行重点可视化;本发明专利技术给司法领域的案件分析提供帮助,为司法人员决策提供参考,推动司法领域可视化分析发展。推动司法领域可视化分析发展。推动司法领域可视化分析发展。

【技术实现步骤摘要】
一种面向涉毒案件的犯罪行为序列可视化方法及系统


[0001]本专利技术属于序列可视化
,具体地,涉及一种面向涉毒案件的犯罪行为序列可视化方法及系统。

技术介绍

[0002]2022年,随着智慧法院的不断发展、完善,不断将人工智能、大数据、数据挖掘、可视化分析等技术与司法相结合帮助法院提升工作效率。数据挖掘技术给能够对案件案情提供新的分析视角并提高分析效率,而可视化将为司法人员提供更加直观便捷的了解案件中规律。
[0003]目前司法案件中毒品犯罪是社会危害性最为严重的犯罪之一。它不仅对人们的身心健康造成极大损害,而且往往引发抢劫、盗窃等其他严重刑事犯罪,形成一系列社会问题,给经济发展和社会和谐稳定构成巨大威胁。从而引发越来越来多的人对涉毒案件进行研究。对涉毒案件中的犯罪行为序列研究能够发现犯罪人员行为中存在的特点并且能够帮助公安人员预测犯罪人员行为。犯罪行为序列是对涉毒类案件案情中的重要行为提取构建而成的序列,每个案件提取成为一个序列。针对犯罪人员行为进行可视化,能够帮助司法人员更加直观的了解案件案情规律,能够展现出每个案件的行为特点,使得司法人员对于案件内容更加容易的理解。

技术实现思路

[0004]本专利技术提出了一种面向涉毒案件的犯罪行为序列可视化方法及系统,以序列中语义相似的节点构建成相似节点树的为基础,将序列中相似的节点进行合并,以最小描述长度作为优化目标挖掘序列中存在的序列模式,并进行序列可视化布局;发现序列模式中存在的焦点,对序列中焦点进行可视化布局;本专利技术能够充分的发掘犯罪行为中存在的规律和焦点;为司法人员提供高效、直观的序列可视化方法。
[0005]本专利技术通过以下技术方案实现:
[0006]一种面向涉毒案件的犯罪行为序列可视化方法:
[0007]所述方法具体包括以下步骤:
[0008]步骤一:数据预处理,使用分词工具提取涉毒案件案情文本中行为词,根据行为词的语义相似性,将犯罪行为序列中的相似行为词构建成相似节点树;
[0009]步骤二:从步骤一构建的相似节点树中选择节点,对犯罪行为序列中的行为词进行合并;
[0010]步骤三:将步骤二合并节点之后产生的序列进行挖掘,挖掘出序列模式,根据序列模式将所有序列划分成簇,将序列表示成序列模式、序列补充和原始序列,进行初步可视化;
[0011]步骤四:采用问答系统提取出步骤三序列模式中的焦点进行重点可视化;最终将大量序列可视化为序列模式、焦点、序列补充和原始序列。
[0012]进一步地,在步骤一中,
[0013]使用涉毒案件案情部分通过word2vec生成预训练词向量,通过查找预训练词向量获取犯罪行为序列中行为词对应的词向量;
[0014]根据行为词的词向量之间的相似度分层,将行为词构建成相似节点树。
[0015]进一步地,在步骤二中,
[0016]所述相似节点树中每个节点生成一个向量Vector_A(s1,s2,

,sm),
[0017]其中m为案件个数,Vector_A向量表示每个案件的行为序列中是否发生该行为或者发生相似节点树中该行为的子行为;
[0018]每个法条生成一个向量Vector_B(s1,s2,

,sm),向量表示每个案件中是否使用该法条;
[0019]通过卡方校验计算两个向量之间的相关度X2,综合各个法条获取到相似节点树中节点信息度量为X2/L,其中L为法条个数;
[0020]根据相似节点树中每个节点的信息度量X2/L进行节点合并,将犯罪行为序列中被选择节点的所有子节点替换成该节点,从而减少相似节点。
[0021]进一步地,在步骤三中,
[0022]将合并节点之后产生的序列进行序列模式提取,根据两个序列之间的描述长度作为优化目标,提取描述长度最小的两个序列的序列模式并将两个序列归并到同一簇内,不断迭代直至所有序列都被归类成簇;将同一簇内的序列可视化成以序列模式、序列补充和原始序列的形式。
[0023]进一步地,在步骤四中,
[0024]将案情相关的法条作为问题,作为问答系统QA的输入,寻找与法条最相关的案情句子,从而找到与案情句子所对应的序列模式节点,将识别的序列模式节点进行重点可视化。
[0025]一种面向涉毒案件的序列可视化系统:
[0026]所述系统包括数据预处理模块、行为词合并模块、序列挖掘模块和焦点可视化模块;
[0027]数据预处理模块,使用分词工具提取涉毒案件案情文本中行为词,根据行为词的语义相似性,将犯罪行为序列中的相似行为词构建成相似节点树;
[0028]行为词合并模块,用于从数据预处理模块构建的相似节点树中选择节点,对犯罪行为序列中的行为词进行合并;
[0029]序列挖掘模块,用于将合并节点之后产生的序列进行挖掘,挖掘出序列模式,根据序列模式将所有序列划分成簇,将序列表示成序列模式和序列补充,进行初步可视化;
[0030]焦点可视化模块,用于采用问答系统提取出序列模式中的焦点进行重点可视化;最终将大量序列可视化为序列模式、焦点、序列补充和原始序列。
[0031]一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0032]一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现上述方法的步骤。
[0033]本专利技术有益效果
[0034]本专利技术在利用句子涉毒案件案情的语义信息的基础上,采用相似节点数形式对节点进行合并,引入序列模式挖掘技术挖掘出序列中的模式,采用问答系统来发现序列模式中的焦点,将大量序列进行可视化为序列模式、焦点、序列补充、原始序列,使得序列可视化能够在小的范围里尽可能多的表示更多的信息,并且能够降低相似节点对于序列分析的干扰,发现序列中存在的模式,对重要信息进行重点可视化展示,这将带来更好的序列可视化效果。这将给司法领域的案件分析提供帮助,为司法人员决策提供参考,推动司法领域可视化分析发展。
[0035]本专利技术以序列中语义相似的节点构建成相似节点树为基础,对序列中相似的节点进行合并,减少视觉上的干扰,为序列的模式挖掘和序列可视化提供良好的基础;使用序列模式挖掘,将高维大量序列进行可视化表示,可以对于犯罪案件中案件属性每一维的值进行分类、排序、组合和显示,进行看到表示对象或事件的数据的多个属性或变量,能够使用少量的布局显示尽可能多的序列数据,并能够发现案件中存在的规律;引入问答系统,发现序列中的重点信息,有效识别焦点,可视化布局能够减少视觉负担,同时也能够帮助司法人员拓展工作时记忆的信息量,便于司法人员对犯罪行为序列进行分析,减少认知的负担,拓展认知能力。
附图说明
[0036]图1为本专利技术总体流程图;
[0037]图2为本专利技术的相似节点合并示意图;
[0038]图3为本专利技术是模式识别示意图。
具体实施方式
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向涉毒案件的犯罪行为序列可视化方法,其特征在于:所述方法具体包括以下步骤:步骤一:数据预处理,使用分词工具提取涉毒案件案情文本中行为词,根据行为词的语义相似性,将犯罪行为序列中的相似行为词构建成相似节点树;步骤二:从步骤一构建的相似节点树中选择节点,对犯罪行为序列中的行为词进行合并;步骤三:将步骤二合并节点之后产生的序列进行挖掘,挖掘出序列模式,根据序列模式将所有序列划分成簇,将序列表示成序列模式、序列补充和原始序列,进行初步可视化;步骤四:采用问答系统提取出步骤三序列模式中的焦点进行重点可视化;最终将大量序列可视化为序列模式、焦点、序列补充和原始序列。2.根据权利要求1所述方法,其特征在于:在步骤一中,使用分词工具提取涉毒案件案情文本中的行为词;使用涉毒案件案情部分通过word2vec生成预训练词向量,通过查找预训练词向量获取犯罪行为序列中行为词对应的词向量;根据行为词的词向量之间的相似度分层,将行为词构建成相似节点树。3.根据权利要求2所述方法,其特征在于:在步骤二中,所述相似节点树中每个节点生成一个向量Vector_A(s1,s2,

,sm),其中m为案件个数,Vector_A向量表示每个案件的行为序列中是否发生该行为或者发生相似节点树中该行为的子行为;每个法条生成一个向量Vector_B(s1,s2,

,sm),向量表示每个案件中是否使用该法条;通过卡方校验计算两个向量之间的相关度X2,综合各个法条获取到相似节点树中节点度量为X2/L,其中L为法条个数;根据相似节点树中每个节点的信息度量X2/L进行节点合并,将犯罪行为序列中被选择节点的所有子节点替换成该节点,从而...

【专利技术属性】
技术研发人员:黄瑞章单志华陈艳平秦永彬
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1