用于公安领域的数据鉴真系统及数据鉴真方法技术方案

技术编号:26730641 阅读:35 留言:0更新日期:2020-12-15 14:31
本发明专利技术公开了一种用于公安领域的数据鉴真系统,并且基于数据鉴真系统进行数据的录入、映射、清洗和关联,从而实现对数据的评估鉴真。本发明专利技术提供了数据来源可信度、时效性、支持度三个维度对数据的真实性、有效性、融合关联的正确性自动进行评估,可以根据数据项的特点,灵活选择和评估维度进行数据评估。

【技术实现步骤摘要】
用于公安领域的数据鉴真系统及数据鉴真方法
本专利技术属于数据处理领域,具体涉及用于公安领域的数据鉴真系统及数据鉴真方法。
技术介绍
推动互联网、大数据、人工智能和实体经济深度融合,掌握丰富的高价值数据资源日益成为抢占未来发展主动权的前提和保障。如何从海量分散数据中提炼数据价值,加大数据利用与管理,以实现数据有效管理和价值应用,成为当前趋势中亟待解决的问题。尤其是在公安领域,随着前端感知类设备的增多和社会资源数据的大规模采集,对数据进行处理、分析、深度挖掘,发现数据的内在规律,为预防、打击犯罪将提供强有力的支撑,以数据驱动警务变革正逐渐成为警务发展的重要趋势,对数据进行智能化治理是有效开展数据研判及服务实战的重要保障,在实际应用过程中仍然面临着以下问题:数据分散,在进行情报研判时,需要多位民警同时在不同系统中进行协作式查询;门户式查询如海底捞针,上级公安机关对数据进行了门户式集成,解决了一部分数据分散问题,但是其本质还是分库式的检索,没有在底层将数据进行关联整合,还是需要民警不断的尝试遍历同一个人的各种特征值信息才能获取其全量信息。数据由于底层没有有效治理,查询出来的结果存在不一致的情况,错误的情况,需要民警自己甄别真假并进行关联融合。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的用于公安领域的数据鉴真系统及数据鉴真方法解决了现有技术中存在的问题。为了达到上述专利技术目的,本专利技术采用的技术方案为:一种用于公安领域的数据鉴真系统,包括资源目录模块、标准库模块、数据采集模块、数据管理模块和数据鉴真模块;所述资源目录模块用于建立统一的资源目录,并为数据管理模块和数据鉴真模块提供数据支持;所述标准库模块用于对系统数据元进行统一标准建设以及数据映射管理,并为数据采集模块提供支持;所述数据采集模块用于将离散数据的采集且导入资源目录模块,将导入的离散数据进行数据映射并为数据管理模块提供数据支持;所述数据管理模块用于数据的检索、修改和清洗,并提供知识图谱分析功能,其并为数据鉴真模块提供数据支持;所述数据鉴真模块用于数据管理模块传递的数据进行鉴真。进一步地,所述资源目录包括资源所属类别、资源代码、资源名称、资源摘要、资源所含字段以及资源信息源。本专利技术的有益效果为:构建了一个数据管理的综合系统,实现了数据的统一管理、清洗以及鉴真。一种基于用于公安领域的数据鉴真系统的数据鉴真方法,包括以下步骤:S1、使用资源目录模块创建资源所属类别,并依次录入资源代码、资源名称、资源摘要、资源所含字段以及资源信息源,完成资源录入;S2、对录入资源进行必填项验证,将验证通过的资源进行存储,完成资源入库;S3、通过标准库模块设置入库资源的映射字段,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源库;S4、通过数据采集模块录入离散数据,选择离散数据的资源目录,且建立离散数据与国家标准规范数据库中数据元的映射关系,得到第二资源库;S5、通过数据管理模块对第二资源库中的数据进行清洗,并以个人身份证信息作为数据节点关联对应的所有数据;S6、将待检索关键词输入数据管理模块,对关联数据后的第二资源库中的数据进行检索,得到待检索关键词对应的检索数据;S7、将检索数据传输至数据鉴真模块,选择评估维度,获取检索数据的综合可信度,完成数据鉴真。进一步地,所述步骤S2中必填项验证包括身份证号、手机号、车牌、银行卡、车牌、社保号码、姓名、地名、行政单位、邮箱和邮编。进一步地,所述步骤S3包括以下分步骤:S31、通过标准库模块选择待映射字段的所属数据元集,设置入库资源的映射字段;S32、在国家标准规范数据库依次选择与映射字段对应的字段,形成对应关系,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源库。进一步地,所述步骤S4中若选择离散数据导入方式为新增数据,则步骤S4包括以下分步骤:S41、构建新增离散数据的模板,并将离散数据录入模板,得到新增离散数据;S42、通过数据采集模块输入新增离散数据的数据表名称以及数据来源,得到离散数据表;S43、在离散数据表中选取待入库的字段,并匹配选择字段所属的资源类别,得到新增入库字段;S44、建立新增入库字段与国家标准规范数据库中数据元的映射关系,将新增入库字段入库至第一资源库,得到第二资源库;所述步骤S4中若选择离散数据导入方式为补充数据,则步骤S4具体为:选择待补充数据的离散数据表,将补充数据录入离散数据表,在离散数据表中选取待入库的字段,并匹配选择字段所属的资源类别,得到新增入库字段,建立新增入库字段与国家标准规范数据库中数据元的映射关系,将新增入库字段入库至第一资源库,得到第二资源库。进一步地,所述步骤S5包括以下分步骤:S51、随机提取一项第二资源库中的个人信息,在国家标准规范数据库提取对其单项身份信息,得到若干单项身份信息;S52、将若干单项身份信息进行字段对齐,消除单项身份信息的隐藏字段;S53、遍历提取的个人信息中的所有身份信息,得到个人信息清洗结果;S54、遍历第二资源库中所有的个人信息,得到第二资源库的数据清洗结果;S55、以个人身份证信息作为数据节点,并以三元组的方式,将其相关信息进行组合,得到若干组合信息;S56、将组合信息进行关联,得到个人信息的知识图谱,遍历第二资源库中所有的个人信息,得到第二资源库中所有个人信息的知识图谱,完成数据关联。进一步地,所述步骤S7中评估维度包括数据来源可信度、数据时效性和数据支持度。进一步地,所述数据来源可信度的获取方法为:设置数据可信度参考值为a和参考值出现范围为[b,c],获取参考值在所有数据来源中出现的次数为d,得到数据来源可信度C为:所述数据时效性的获取方法为:设置数据更新周期叠加值为e,根据更新周期叠加值获取数据时效性S为:S=C×e×p其中,p为周期值;所述数据支持度的获取方法为:设置若干数据出现次数范围,并且每个范围设置一个对应的叠加基数,采集数据出现次数为f,获取数据支持度H为:H=gfC×100%其中,gf表示数据出现次数f所在数据出现次数范围对应的叠加基数。进一步地,所述步骤S7中选择评估维度,获取检索数据的综合可信度的具体方法为:若选择数据维度为数据来源可信度,则综合可信度为数据来源可信度值;若选择数据维度为数据来源可信度和数据时效性,则综合可信度为数据时效性值;若选择数据维度为数据来源可信度和数据支持度,则综合可信度为数据支持度;若选择数据维度为数据来源可信度、数据时效性和数据支持度,则综合可信度为gf*S。本专利技术的有益效果为:(1)本专利技术采用自织网模型对实战业务关注的人、事、地、物、组织进行智能化关联,形成知识网,改变传统的底层数据组织方式,打破传统门户式的分库检索模式,提供多路本文档来自技高网...

【技术保护点】
1.一种用于公安领域的数据鉴真系统,其特征在于,包括资源目录模块、标准库模块、数据采集模块、数据管理模块和数据鉴真模块;/n所述资源目录模块用于建立统一的资源目录,并为数据管理模块和数据鉴真模块提供数据支持;/n所述标准库模块用于对系统数据元进行统一标准建设以及数据映射管理,并为数据采集模块提供支持;/n所述数据采集模块用于将离散数据的采集且导入资源目录模块,将导入的离散数据进行数据映射并为数据管理模块提供数据支持;/n所述数据管理模块用于数据的检索、修改和清洗,并提供知识图谱分析功能,其并为数据鉴真模块提供数据支持;/n所述数据鉴真模块用于数据管理模块传递的数据进行鉴真。/n

【技术特征摘要】
1.一种用于公安领域的数据鉴真系统,其特征在于,包括资源目录模块、标准库模块、数据采集模块、数据管理模块和数据鉴真模块;
所述资源目录模块用于建立统一的资源目录,并为数据管理模块和数据鉴真模块提供数据支持;
所述标准库模块用于对系统数据元进行统一标准建设以及数据映射管理,并为数据采集模块提供支持;
所述数据采集模块用于将离散数据的采集且导入资源目录模块,将导入的离散数据进行数据映射并为数据管理模块提供数据支持;
所述数据管理模块用于数据的检索、修改和清洗,并提供知识图谱分析功能,其并为数据鉴真模块提供数据支持;
所述数据鉴真模块用于数据管理模块传递的数据进行鉴真。


2.根据权利要求1所述的用于公安领域的数据鉴真系统,其特征在于,所述资源目录包括资源所属类别、资源代码、资源名称、资源摘要、资源所含字段以及资源信息源。


3.一种基于权利要求2所述用于公安领域数据鉴真系统的数据鉴真方法,其特征在于,包括以下步骤:
S1、使用资源目录模块创建资源所属类别,并依次录入资源代码、资源名称、资源摘要、资源所含字段以及资源信息源,完成资源录入;
S2、对录入资源进行必填项验证,将验证通过的资源进行存储,完成资源入库;
S3、通过标准库模块设置入库资源的映射字段,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源库;
S4、通过数据采集模块录入离散数据,选择离散数据的资源目录,且建立离散数据与国家标准规范数据库中数据元的映射关系,得到第二资源库;
S5、通过数据管理模块对第二资源库中的数据进行清洗,并以个人身份证信息作为数据节点关联对应的所有数据;
S6、将待检索关键词输入数据管理模块,对关联数据后的第二资源库中的数据进行检索,得到待检索关键词对应的检索数据;
S7、将检索数据传输至数据鉴真模块,选择评估维度,获取检索数据的综合可信度,完成数据鉴真。


4.根据权利要求3所述的数据鉴真方法,其特征在于,所述步骤S2中必填项验证包括身份证号、手机号、车牌、银行卡、车牌、社保号码、姓名、地名、行政单位、邮箱和邮编。


5.根据权利要求3所述的数据鉴真方法,其特征在于,所述步骤S3包括以下分步骤:
S31、通过标准库模块选择待映射字段的所属数据元集,设置入库资源的映射字段;
S32、在国家标准规范数据库依次选择与映射字段对应的字段,形成对应关系,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源库。


6.根据权利要求3所述的数据鉴真方法,其特征在于,所述步骤S4中若选择离散数据导入方式为新增数据,则步骤S4包括以下分步骤:
S41、构建新增离散数据的模板,并将离散数据录入模板,得到新增离散数据;
S42、通过数据采集模块输入新增离散...

【专利技术属性】
技术研发人员:孙浩天董丞业刘国荣
申请(专利权)人:新疆泰克软件开发有限公司
类型:发明
国别省市:新疆;65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1