【技术实现步骤摘要】
本专利技术涉及实体识别和关键字提取、案件要素识别提取模型选择与构建、后处理与整合的,具体来说,涉及一种基于自然语言处理技术的案件要素提取方法。
技术介绍
1、近年来非接触类侵财案件不断高发多发,此类案件中通常围绕案件嫌疑人、案发地点、机构、资金信息、资金关系、虚拟身份、app等等信息开展分析工作。通过对案件要素数据、要素关联规则数据的提取,支撑案件的分析研判,提高串并案挖掘的准确性。
2、目前案件要素数据提取的主要方法还集中于关键词文本分词等手段,该方法难以挖掘要素之间的关联关系,不能适应复杂的自然语言文本的案情描述。要素抽取的精度较低,容易遗漏案件中的要素或错误抽取要素。
3、因此,需要一种有效准确的案件信息要素和关系识别提取的方法工具,满足公安对案件深度分析挖掘的需要。
技术实现思路
1、针对相关技术中的问题,本专利技术提出一种基于自然语言处理技术的案件要素提取方法,以克服现有相关技术所存在的上述技术问题。
2、为此,本专利技术采用的具体技术方案如下
3、本文档来自技高网...
【技术保护点】
1.一种基于自然语言处理技术的案件要素提取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于自然语言处理技术的案件要素提取方法,其特征在于:步骤S1中收集案件相关的大量数据,对该数据进行预处理。处理内容包括数据清洗、特征提取和数据标注等。通过正则表达式(Regex)清洗数据和特征处理。
3.根据权利要求1所述的一种基于自然语言处理技术的案件要素提取方法,其特征在于:步骤S2中案件要素特征选择是指从原始数据中选择案件有关的要素特征变量。主要案件要素特征有涉案人信息、涉案时间、案发地点、涉案组织机构、涉案资金信息、转账关系、虚拟身份
...【技术特征摘要】
1.一种基于自然语言处理技术的案件要素提取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于自然语言处理技术的案件要素提取方法,其特征在于:步骤s1中收集案件相关的大量数据,对该数据进行预处理。处理内容包括数据清洗、特征提取和数据标注等。通过正则表达式(regex)清洗数据和特征处理。
3.根据权利要求1所述的一种基于自然语言处理技术的案件要素提取方法,其特征在于:步骤s2中案件要素特征选择是指从原始数据中选择案件有关的要素特征变量。主要案件要素特征有涉案人信息、涉案时间、案发地点、涉案组织机构、涉案资金信息、转账关系、虚拟身份信息、人员关系、物品信息、案件特征、作案手法等信息。
4.根据权利要求1所述的一种基于自然语言处理技术的案件要素提取方法,其特征在于:步骤s3中建立标注工具,建立案件常见要素实体、关系标签,提供案件文本选择标注、审核、质检功能,人工标注、审核和质检。实时可视化管理系统,提高人机协作、标注效率。
5.根据权利要求1所述的一种基于自然语言处理技术的案件要素提取方法,其特征在于:步骤s4中案件要素标注过程:筛选审核案件信...
【专利技术属性】
技术研发人员:马国春,王战英,王占宏,施苗苗,冯佳乐,
申请(专利权)人:上海众恒软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。