一种基于语义分析的案件关键词汇提取与标注方法技术

技术编号:38144631 阅读:19 留言:0更新日期:2023-07-08 10:01
本发明专利技术公开了一种基于语义分析的案件关键词汇提取与标注方法,包括以下步骤:S1、构建类案关键词库;S2、构建智能提取关键词模型;S3、将新采集的人员通讯设备中的数据输入至步骤S2构建的智能提取关键词模型中,智能提取新采集数据的关键词和标识号;S4、将步骤S3中提取出的关键词与步骤S1中类案关键词库内的类案关键词比对,利用比对结果对人员和标识号进行打标签。本发明专利技术是利用人工智能和大数据分析技术对涉案人员的手机采集数据中的文本内容进行关键词提取和比对分析,让工作人员在海量的电子数据中,分析涉案人员的行为倾向,快速得到有价值的案件线索,提高了案件的侦查效率和破案率。和破案率。和破案率。

【技术实现步骤摘要】
一种基于语义分析的案件关键词汇提取与标注方法


[0001]本专利技术涉及案件分析
,更具体涉及一种基于语义分析的案件关键词汇提取与标注方法。

技术介绍

[0002]入所嫌疑人员的手机中保存的文本数据,对案件的研判具有一定的指导意义。目前很多系统平台在对嫌疑人员被采集的手机数据中的文本内容的分析过程中,往往都是简单地提取文本中出现的身份证号、银行卡账号等标识号,对文本进行分词和分析语言特征,提取人名、地名、物品等词语以及分析词语出现的频次等。这些都还是简单的关键词分析提取,这样分析提取出来的关键词与各类案件之间没有很直接的关系提示,还需要工作人员进一步结合各类线索和平台进行综合地研判和分析之后才能找到有价值的线索。同时也无法提前预警可能存在或者已经发生的事件倾向。

技术实现思路

[0003]本专利技术需要解决的技术问题是提供一种基于语义分析的案件关键词汇提取与标注方法,让工作人员在海量的电子数据中,分析涉及人员的行为倾向,快速得到有价值的案件线索,提高案件的侦查效率。
[0004]为解决上述技术问题,本专利技术所采取本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于语义分析的案件关键词汇提取与标注方法,其特征在于,包括以下步骤:S1、构建类案关键词库;S2、构建智能提取关键词模型;S3、将新采集的人员通讯设备中的数据输入至步骤S2构建的智能提取关键词模型中,智能提取新采集数据的关键词和标识号;S4、将步骤S3中提取出的关键词与步骤S1中类案关键词库内的类案关键词比对,利用比对结果对人员和标识号进行打标签。2.根据权利要求1所述的一种基于语义分析的案件关键词汇提取与标注方法,其特征在于,所述步骤S1包括以下步骤:S11、搭建数据仓库,构建类案原始关键词表;S12、对历史案件采集的电子数据中的文本内容进行分词操作,对关键词进行提取,并将提取的关键词记录到步骤S11数据仓库中的类案原始关键词表中;S13、利用大数据分析技术,对类案原始关键词表中的关键词进行分析;S14、人工干预筛选,设置关键词权重。3.根据权利要求2所述的一种基于语义分析的案件关键词汇提取与标注方法,其特征在于,所述步骤S12中,进行分词操作时,每分析一个段落,则为该段落随机生成一个段落ID,每分析一个语句,则随机生成一个语句ID;提取文本中的词语和词语特征关键词。4.根据权利要求3所述的一种基于语义分析的案件关键词汇提取与标注方法,其特征在于,所述步骤S13中,对类案原始关键词表中的数据是按类案和不同文本场景进行分析,分析出高频关键词,以及关键词在同段落和同语句共同出现的次数情况。5.根据权利要求4所述的一种基于语义分析的案件关键词汇...

【专利技术属性】
技术研发人员:刘怀春吴海平李建华龚波苏学武水军
申请(专利权)人:珠海市新德汇信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1