【技术实现步骤摘要】
一种面向涉毒案件的犯罪行为序列可视化方法及系统
[0001]本专利技术属于序列可视化
,具体地,涉及一种面向涉毒案件的犯罪行为序列可视化方法及系统。
技术介绍
[0002]2022年,随着智慧法院的不断发展、完善,不断将人工智能、大数据、数据挖掘、可视化分析等技术与司法相结合帮助法院提升工作效率。数据挖掘技术给能够对案件案情提供新的分析视角并提高分析效率,而可视化将为司法人员提供更加直观便捷的了解案件中规律。
[0003]目前司法案件中毒品犯罪是社会危害性最为严重的犯罪之一。它不仅对人们的身心健康造成极大损害,而且往往引发抢劫、盗窃等其他严重刑事犯罪,形成一系列社会问题,给经济发展和社会和谐稳定构成巨大威胁。从而引发越来越来多的人对涉毒案件进行研究。对涉毒案件中的犯罪行为序列研究能够发现犯罪人员行为中存在的特点并且能够帮助公安人员预测犯罪人员行为。犯罪行为序列是对涉毒类案件案情中的重要行为提取构建而成的序列,每个案件提取成为一个序列。针对犯罪人员行为进行可视化,能够帮助司法人员更加直观的了解案件案情规律,能够展 ...
【技术保护点】
【技术特征摘要】
1.一种面向涉毒案件的犯罪行为序列可视化方法,其特征在于:所述方法具体包括以下步骤:步骤一:数据预处理,使用分词工具提取涉毒案件案情文本中行为词,根据行为词的语义相似性,将犯罪行为序列中的相似行为词构建成相似节点树;步骤二:从步骤一构建的相似节点树中选择节点,对犯罪行为序列中的行为词进行合并;步骤三:将步骤二合并节点之后产生的序列进行挖掘,挖掘出序列模式,根据序列模式将所有序列划分成簇,将序列表示成序列模式、序列补充和原始序列,进行初步可视化;步骤四:采用问答系统提取出步骤三序列模式中的焦点进行重点可视化;最终将大量序列可视化为序列模式、焦点、序列补充和原始序列。2.根据权利要求1所述方法,其特征在于:在步骤一中,使用分词工具提取涉毒案件案情文本中的行为词;使用涉毒案件案情部分通过word2vec生成预训练词向量,通过查找预训练词向量获取犯罪行为序列中行为词对应的词向量;根据行为词的词向量之间的相似度分层,将行为词构建成相似节点树。3.根据权利要求2所述方法,其特征在于:在步骤二中,所述相似节点树中每个节点生成一个向量Vector_A(s1,s2,
…
,sm),其中m为案件个数,Vector_A向量表示每个案件的行为序列中是否发生该行为或者发生相似节点树中该行为的子行为;每个法条生成一个向量Vector_B(s1,s2,
…
,sm),向量表示每个案件中是否使用该法条;通过卡方校验计算两个向量之间的相关度X2,综合各个法条获取到相似节点树中节点度量为X2/L,其中L为法条个数;根据相似节点树中每个节点的信息度量X2/L进行节点合并,将犯罪行为序列中被选择节点的所有子节点替换成该节点,从而...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。