一种基于正则表达式的公安交管业务数据处理和录入方法技术

技术编号:21142554 阅读:43 留言:0更新日期:2019-05-18 05:34
本发明专利技术公开了一种基于正则表达式的公安交管业务数据处理和录入方法,其步骤如下:获取公安交管业务历史数据;根据获取的数据,分析单一业务所需数据和多业务联合分析所需数据构成规则,确定业务数据的重点关注字段;根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正;根据建立的正则表达式库,对公安交管业务数据的录入系统进行优化。本发明专利技术采用正则表达式工具,结合公安交管综合业务数据的特征和构成规则等设计了公安交管综合业务数据标准正则式库,能够为公安交管业务提供数据分析的重要基础工具和数据标准规范。

【技术实现步骤摘要】
一种基于正则表达式的公安交管业务数据处理和录入方法
本专利技术涉及交通领域。具体而言是一种基于正则表达式的公安交管业务数据处理和录入方法。
技术介绍
随着公安交管信息系统不断建立和完善,在实际公安交管业务工作中,利用信息化手段采集了大量的社会信息资源。充分整合利用这些资源,规范化业务数据,能够大力提高公安工作的科技含量,切实加快公安工作的信息化步伐,有力的带动和促进公安工作现代化、正规化建设,有效的提升公安整体战斗力。目前,公安交管核心业务数据缺少统一的、规范的异常数据评判标准。公安交通管理综合应用平台在设计和应用过程中已经对每个字段和重要的表间关联字段进行规范,可以很好地在录入阶段起到减少异常业务数据产生。但是,由于一些过细的数据录入需求、过多重复录入项目和一线干警实际操作能力参差不齐等原因,导致数据录入错、误、漏等现象仍然很多,而这些规范和标准大部分集成在综合应用平台内部,无法单独提取形成统一的异常数据评判标准,也难以根据业务情况加以拓展,无法为已入库数据的业务逻辑错误等深层次业务异常分析提供支持。
技术实现思路
本专利技术所要解决的问题是处理在大量交管业务数据中存在的缺失与异常数据,提出了一种基于正则表达式的公安交管业务数据处理和录入方法,分析数据录入异常,规范数据录入行为。为解决上述技术问题,本专利技术采用如下的技术方案是:一种基于正则表达式的公安交管业务数据处理和录入方法,包括以下步骤:步骤1:获取公安交管业务历史数据。本专利技术涉及的公安交管业务数据包括及机动车登记数据、驾驶证管理数据、交通违法处理数据、交通事故处理数据、交警队基础信息、剧毒化学品公路运输数据等。机动车登记数据:全国公安采集的关于已合法登记的机动车数据等信息。该数据在全国公安交管部门联网、可查。驾驶证管理数据:登记在册并经过认可的机动车驾驶员数据,包括其姓名、身份编号(身份证号码)、驾驶证类型、联系方式等。交通违法处理数据:为交通违法相关信息数据,具体包括交通违法代码、交通违章行为、交通违章地点、处理结果等。交通事故处理数据:为交通事故相关信息数据,具体包括事故的类型、事故地点、事故事件、事故双方基本信息以及事故责任划分等。交警队基础信息:大中队基本信息、巡逻执勤信息、宣传台账信息、接处警信息等。剧毒化学品公路运输数据:剧毒化学品信息、承运单位信息、驾驶人信息、押运人信息、运输路线信息、运输时间信息等。步骤2:根据步骤1获取的数据,分析单一业务所需数据和多业务联合分析所需数据构成规则,确定业务数据的重点关注字段。所述数据构成规则包括业务数据涉及的所有字段名称、类型和属性。步骤3:根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库。3.1根据重点关注字段的类型和属性,结合$或至少一个用于匹配任意字符的特定符号分别作为正则表达式的匹配项,并根据语法结构,将所述匹配项进行排序,形成至少一个正则表达式。3.2将交管业务数据中的每类业务数据作为一个节点,为每个节点进行编号以明确该节点所代表的业务范围,并根据各节点的连接关系和该编号,计算出多业务中每个节点的正则表达式,并将所有该正则表达式集合,作为该类数据结构字符串码,建立规范的正则表达式库。步骤4:根据步骤3建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正。使用Python高级编程语言中的re标准库提供的功能函数以及凝练的公安交管数据正则表达库,进行多种方式地灵活组合、匹配,对公安交管业务数据进行分析。所述异常录入数据包括缺值项、与定义的字段类型不符的数据项、与定义的字段属性不符的数据项。步骤5:根据步骤3建立的正则表达式库,对公安交管业务数据的录入系统进行优化。5.1将正则表达式与录入字段进行关联;5.2当录入内容与设定的正则表达式不相符时,录入系统提示数据录入异常,重新输入数据。与现有技术相比,本专利技术的有益效果是:本专利技术采用正则表达式工具,结合公安交管综合业务数据的特征和构成规则等设计了公安交管综合业务数据标准正则式库,并提供了异常录入数据分析方法和数据录入优化方法,能够为公安交管业务提供数据分析的重要基础工具和数据标准规范,保证数据录入质量。附图说明图1为本专利技术的流程图。具体实施方式下面结合实际过程对本专利技术做具体的介绍。本专利技术的实现路线包括以下几步:步骤1:获取公安交管业务历史数据。本专利技术涉及的公安交管业务数据包括及机动车登记数据、驾驶证管理数据、交通违法处理数据、交通事故处理数据、交警队基础信息、剧毒化学品公路运输数据等。机动车登记数据:全国公安采集的关于已合法登记的机动车数据等信息。该数据在全国公安交管部门联网、可查。驾驶证管理数据:登记在册并经过认可的机动车驾驶员数据,包括其姓名、身份编号(身份证号码)、驾驶证类型、联系方式等。交通违法处理数据:为交通违法相关信息数据,具体包括交通违法代码、交通违章行为、交通违章地点、处理结果等。交通事故处理数据:为交通事故相关信息数据,具体包括事故的类型、事故地点、事故事件、事故双方基本信息以及事故责任划分等。交警队基础信息:大中队基本信息、巡逻执勤信息、宣传台账信息、接处警信息等。剧毒化学品公路运输数据:剧毒化学品信息、承运单位信息、驾驶人信息、押运人信息、运输路线信息、运输时间信息等。步骤2:根据步骤1获取的数据,分析单一业务所需数据和多业务联合分析所需数据构成规则,确定业务数据的重点关注字段。所述数据构成规则包括业务数据涉及的所有字段名称、类型和属性。步骤3:根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库。3.1根据重点关注字段的类型和属性,结合$或至少一个用于匹配任意字符的特定符号分别作为正则表达式的匹配项,并根据语法结构,将所述匹配项进行排序,形成至少一个正则表达式。3.2将交管业务数据中的每类业务数据作为一个节点,为每个节点进行编号以明确该节点所代表的业务范围,并根据各节点的连接关系和该编号,计算出多业务中每个节点的正则表达式,并将所有该正则表达式集合,作为该类数据结构字符串码,建立规范的正则表达式库。本专利技术部分典型实例如下:步骤4:根据步骤3建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正。使用Python高级编程语言中的re标准库提供的功能函数以及凝练的公安交管数据正则表达库,进行多种方式地灵活组合、匹配,对公安交管业务数据进行分析。涉及的Python高级编程语言中re标准库的具体功能函数包括:(1)re.search()在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象。(2)re.match()从一个字符串的开始位置起匹配正则表达式,返回match对象。(3)re.findall()搜索字符串,以列表类型返回全部能匹配的子串。(4)re.split()将一个字符串按照正则表达式匹配结果进行分割,返回列表类型。(5)re.finditer()搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象。(6)re.sub()在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串。所述异常录入数据包括缺值项、与定义的字段类型不符的数据项、与定义的字段属性不符的数据项。步本文档来自技高网...

【技术保护点】
1.一种基于正则表达式的公安交管业务数据处理和录入方法,其特征在于,所述的基于正则表达式的公安交管业务数据处理和录入方法的步骤如下:步骤1:获取公安交管业务历史数据;步骤2:根据步骤1获取的数据,分析单一业务所需数据和多业务联合分析所需数据构成规则,确定业务数据的重点关注字段;步骤3:根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库,其中包括,3.1根据重点关注字段的类型和属性,结合$或至少一个用于匹配任意字符的特定符号分别作为正则表达式的匹配项,并将所述匹配项进行排序,形成至少一个正则表达式;3.2将交管业务数据中的每类业务数据作为一个节点,为每个节点进行编号以明确该节点所代表的业务范围,并根据各节点的连接关系和该编号,计算出多业务中每个节点的正则表达式,并将所有该正则表达式集合,作为该类数据结构字符串码,建立规范的正则表达式库;步骤4:根据步骤3建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正;所述异常录入数据包括缺值项、与定义的字段类型不符的数据项、与定义的字段属性不符的数据项;使用Python高级编程语言中的re标准库提供的功能函数以及凝练的公安交管数据正则表达库,对公安交管业务数据进行分析;步骤5:根据步骤3建立的正则表达式库,对公安交管业务数据的录入系统进行优化,其中包括:5.1将正则表达式与录入字段进行关联;5.2当录入内容与设定的正则表达式不相符时,录入系统提示数据录入异常,重新输入数据。...

【技术特征摘要】
1.一种基于正则表达式的公安交管业务数据处理和录入方法,其特征在于,所述的基于正则表达式的公安交管业务数据处理和录入方法的步骤如下:步骤1:获取公安交管业务历史数据;步骤2:根据步骤1获取的数据,分析单一业务所需数据和多业务联合分析所需数据构成规则,确定业务数据的重点关注字段;步骤3:根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库,其中包括,3.1根据重点关注字段的类型和属性,结合$或至少一个用于匹配任意字符的特定符号分别作为正则表达式的匹配项,并将所述匹配项进行排序,形成至少一个正则表达式;3.2将交管业务数据中的每类业务数据作为一个节点,为每个节点进行编号以明确该节点所代表的业务范围,并根据各节点的连接关系和该编号,计算出多业务中每个节点的正则表达式,并将所有该正则表达式集合,作为该类数据结构字符串码,建立规范的正则表达式库;步骤4:根据步骤3建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正;所述异常录入数据包括缺值项、与定义的字段类型不符的数据项、与定义的字段属性不符的数据项;使用Python高级编程语言中的re标准库提供的功能函数以及凝练的公安交管数据正则表达库,对公安交管业务数据进行分析;步骤5:根据步骤3建立的正则表...

【专利技术属性】
技术研发人员:王家捷吴坚宋志洪陈家旭刘广可
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1