一种公安交管业务异常数据综合研判方法及系统技术方案

技术编号:21143442 阅读:70 留言:0更新日期:2019-05-18 05:50
本发明专利技术公开了一种公安交管业务异常数据综合研判方法及系统,具体技术方案如下:对数据进行预处理,完成数据清洗、数据转换、数据集成等工作;构建正则表达式库,对数据进行处理,规范数据表达;通过Apriori算法分析公安交管业务历史数据之间的关联规则,建立异常数据研判模型;利用软件在环检测技术,实时检测异常数据并对数据进行整合分析。本发明专利技术能够快速有效地检测公安交管业务数据中的异常数据,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障。

A Method and System for Comprehensive Research and Judgment of Abnormal Data in Public Security Traffic Management Business

【技术实现步骤摘要】
一种公安交管业务异常数据综合研判方法及系统
本专利技术涉及交通数据分析领域。具体而言是一种公安交管业务异常数据综合研判方法及系统。
技术介绍
随着公安交通管理综合应用平台(简称“综合应用平台”,又称“六合一”)的广泛应用,该系统已经成为各级公安交管部门业务开展的核心平台,对提升各级交管业务部门管理能力和服务水平起到了不可替代的重要作用。但是,由于一线干警在对信息系统的理解和重视程度参差不齐,在信息录入时随意性较大,部分地区录入偏好于“其它”等公用类型,同时伴随实际业务开展逐步完善的系统功能建设也产生大量历史数据等现实问题,导致核心业务数据中仍然大量存在空白字段、身份号码中性别与性别字段不符、关键指标大幅偏离均值等现象,大大降低了这些“种子数据”在综合研判和数据分析中的关键作用,也无法很好地为相关业务数据关联关系的建立发挥“传导介质”作用。一些深层次的业务逻辑问题和异常状态数据的发现还主要依靠分析人员的工作经验,评估效率低、覆盖范围小、难以为业务开展提供很好的指导作用等问题还比较突出。
技术实现思路
本专利技术的目的在于提供一种公安交管业务异常数据综合研判方法及系统,以解决上述
技术介绍
中提出的问题。为实现上述专利技术目的,本专利技术采用如下的技术方案:一种公安交管业务异常数据综合研判方法,其实现步骤如下:步骤一:数据预处理。将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。步骤二:建立正则表达式库,对数据进行处理。2.1对步骤一预处理后的业务数据,分析业务数据构成规则,确定业务数据的重点关注字段;2.2根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;2.3根据建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正,建立公安交管业务数据库D1。步骤三:建立异常数据研判模型。通过Apriori算法分析公安交管业务历史数据之间的关联规则,进而通过关联规则对业务异常数据进行分析研判。3.1针对数据库D1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;3.2整合数据库D1中未建立异常数据识别规则的字段,建立数据库D2,对数据库D2中的数量属性字段进行离散化;3.3根据Apriori算法,生成候选项集Ck和频繁项集Lk;3.4当数据库D2增加新的数据集d时,引入参数i(1<i<∞),计算新的频繁项集Lk';3.5计算强关联规则;3.6根据强关联规则和交管业务历史数据,建立数据异常研判模型。步骤四:异常数据实时在环检测。通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。一种公安交管业务异常数据综合研判系统,包括数据预处理子系统、正则表达子系统、异常数据研判子系统和在环检测子系统。所述数据预处理子系统,将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。所述正则表达子系统,对预处理之后的公安交管业务数据进行分析,包括业务分类、业务关联分析以及业务数据提取。使用正则表达式对数据分析,分析数据的构成规则,凝练跨业务数据正则表达式,构建正则表达式库。所述异常数据研判子系统,通过Apriori算法分析公安交管业务数据之间的关联规则,进而通过关联规则对业务异常数据进行研判。所述在环检测子系统,通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,并生成分析报告,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。与现有技术相比,本专利技术的有益效果是:本专利技术能够快速有效地检测公安交管业务数据中的异常数据,通过在环检测技术,能够在不影响业务系统性能和业务工作开展的前提下,实施数据检测并生成分析报告,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障。附图说明图1为公安交管业务异常数据综合研判方法的流程图图2为异常数据实时在环检测方法的流程图图3为公安交管业务异常数据综合研判系统的结构示意图具体实施方式下面结合实际过程对本专利技术做具体的介绍。本专利技术提供了一种公安交管业务异常数据综合研判方法,其实现步骤如下:步骤一:数据预处理。将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。步骤二:构建正则表达式库。2.1对步骤一预处理后的业务数据,分析业务数据构成规则,确定业务数据的重点关注字段;2.2根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;2.3根据建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正,建立公安交管业务数据库D1。步骤三:建立异常数据研判模型。通过Apriori算法分析公安交管业务历史数据之间的关联规则,进而通过关联规则对业务异常数据进行分析研判。3.1针对数据库D1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;3.2整合数据库D1中未建立异常数据识别规则的字段,建立数据库D2,对数据库D2中的数量属性字段进行离散化;3.3根据Apriori算法,生成候选项集Ck和频繁项集Lk;3.4当数据库D2增加新的数据集d时,引入参数i(1<i<∞),计算新的频繁项集Lk';3.5计算强关联规则;3.6根据强关联规则和交管业务历史数据,建立数据异常研判模型。步骤四:异常数据实时在环检测。通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。本专利技术提供的一种公安交管业务异常数据综合研判方法能够快速有效地检测公安交管业务数据中的异常数据,通过在环检测技术,能够在不影响业务系统性能和业务工作开展的前提下,实施数据检测并生成分析报告,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障。与上述方法相对应的,本专利技术还提供了一种公安交管业务异常数据综合研判系统,包括数据预处理子系统、正则表达子系统、异常数据研判子系统和在环检测子系统。所述数据预处理子系统,将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。所述正则表达子系统,对预处理之后的公安交管业务数据进行分析,包括业务分类、业务关联分析以及业务数据提取。使用正则表达式对数据分析,分析数据的构成规则,凝练跨业务数据正则表达式,构建正则表达式库。所述异常数据研判子系统,通过Apriori算法分析公安交管业务数据之间的关联规则,进而通过关联规则对业务异常数据进行研判。所述在环检测子系统,通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,并生成分析报告,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。所述数据预处理子系统,其处理的数据主要包括机动车登记数据、驾驶证管理数据、交通违法处理数据、交通事故处理数据、交警队基础信息、剧毒化学品公路运输数据。(1)机动车登记数据:全国公安采集的关于已合法登记的机动车数据,包括机动车序号、号牌种类、号牌号码、车辆型号、车辆识别代码、使用性质、机动车所有人等。(2)驾驶证管理数据:登记在册并经本文档来自技高网...

【技术保护点】
1.一种公安交管业务异常数据综合研判方法,其特征在于,所述的公安交管业务异常数据综合研判方法的步骤如下:步骤一:数据预处理将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成工作;步骤二:建立正则表达式库,对数据进行处理其中包括,2.1对步骤一预处理后的业务数据,分析业务数据构成规则,确定业务数据的重点关注字段;2.2根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;2.3根据建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正,建立公安交管业务数据库D1;步骤三:建立异常数据研判模型通过Apriori算法分析公安交管业务历史数据之间的关联规则,进而通过关联规则对业务异常数据进行分析研判,其中包括,3.1针对数据库D1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;3.2整合数据库D1中未建立异常数据识别规则的字段,建立数据库D2,对数据库D2中的数量属性字段进行离散化;3.3根据Apriori算法,生成候选项集Ck和频繁项集Lk;3.4当数据库D2增加新的数据集d时,引入参数i(1<i<∞),计算新的频繁项集Lk,;3.5计算强关联规则;3.6根据强关联规则和交管业务历史数据,建立数据异常研判模型;步骤四:异常数据实时在环检测通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。...

【技术特征摘要】
1.一种公安交管业务异常数据综合研判方法,其特征在于,所述的公安交管业务异常数据综合研判方法的步骤如下:步骤一:数据预处理将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成工作;步骤二:建立正则表达式库,对数据进行处理其中包括,2.1对步骤一预处理后的业务数据,分析业务数据构成规则,确定业务数据的重点关注字段;2.2根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;2.3根据建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正,建立公安交管业务数据库D1;步骤三:建立异常数据研判模型通过Apriori算法分析公安交管业务历史数据之间的关联规则,进而通过关联规则对业务异常数据进行分析研判,其中包括,3.1针对数据库D1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;3.2整合数据库D1中未建立异常数据识别规则的字段,建立数据库D2,对数据库D2中的数量属性字段进行离散化;3.3根据Apriori算法,生成候选项集Ck和频繁项集Lk;3.4当数据库D2增加新的数据集d时,引入参数i(1&l...

【专利技术属性】
技术研发人员:王家捷李国强刘俊苟启文李冬亮
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1