一种基于搜索引擎的重复报警识别方法和系统技术方案

技术编号:13965854 阅读:41 留言:0更新日期:2016-11-09 11:56
本发明专利技术涉及一种基于搜索引擎的重复报警识别方法和系统,所述方法包括以下步骤:S1、构建GIS地址库;S2、设定事发要素权重值及重复报警阈值;S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算Δt时期内覆盖半径范围内的报警信息;S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。能够识别有效重复报警,识别准确率较高,能够提高接处警效率。

【技术实现步骤摘要】

本专利技术涉及公安、医疗接警领域,更具体的说,是涉及一种基于搜索引擎的重复报警识别方法和系统
技术介绍
现有重复信息识别的方法主要是对单要素文本进行分词计算匹配度,而没有对多要素分词匹配计算信息综合匹配度,导致匹配度不高。且现有重复信息识别的方法没有涉及时间、空间的匹配处理。对于公安、医疗接警领域,时间、空间是很重要的要素,对于时间、空间的匹配处理能够大大提到重复信息识别的准确率。在公安、医疗接警领域,目前能够给接警员提供识别有效重复警情的工具几乎没有,识别重复警情更多的依赖于人的经验及运气,重复警情识别率低,导致接警、派警、处警各环节处理重复警情时均存在人力资源浪费的情况。如何通过智能方法有效识别重复警情,减少资源浪费,提高接处警效率,成为亟待解决的问题。
技术实现思路
有鉴于此,有必要针对上述问题,提供一种基于搜索引擎的重复报警识别方法和系统,能够识别有效重复报警,识别准确率较高,能够提高接处警效率。为了实现上述目的,本专利技术的技术方案如下:一种基于搜索引擎的重复报警识别方法,包括以下步骤:S1、构建GIS地址库;S2、设定事发要素权重值及重复报警阈值;S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算Δt时期内覆盖半径范围内的报警信息;S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。作为优选的,在步骤S2中,所述事发要素包括事发地址、事发时间、事发类型、报警人姓名、报警人电话、报警描述。作为优选的,所述步骤S3具体包括:将事发地址进行分词,并通过搜索引擎将分词结果与GIS地址库地址进行匹配,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标。作为优选的,所述步骤S4中,一定时期Δt内覆盖半径范围内的报警信息满足的条件为:事发时间t1—待查询的事发时间t2<Δt(事发地址坐标经度lon—待查询的事发地址坐标经度x)2+(事发地址坐标纬度lat—待查询的事发地址坐标纬度y)2<事发地址覆盖范围半径r2(距离转换为经纬度单位)。作为优选的,所述步骤S2中,根据事发要素属性及批量数据实验确定各要素权重值(v1,v2,v3...vN),阈值Vmin。作为优选的,所述步骤S5具体包括:将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,得到各要素匹配度(m1,m2,m3...mN),与每条报警信息匹配度(v1*m1,v2*m2,v3*m3...vN*mN),匹配度与阈值Vmin进行比较,大于Vmin的报警信息则提示为可能重复报警。作为优选的,所述事发各要素匹配度计算报警信息匹配度与阈值比较的过程包括:v1*m1+v2*m2+v3*m3...+vN*mN>Vmin。作为优选的,还包括步骤S6:将当前报警信息与识别的重复报警信息对比展示,进行人工二次确认。一种根据上述方法进行重复报警识别的系统,包括报警模块和重复报警识别模块,所述报警模块包括接警系统客户端和接警系统数据库;所述重复报警识别模块包括地址库、分词工具、搜索引擎、比较判断单元;所述接警系统客户端用于将报警数据录入到接警系统数据库;所述接警系统数据库用于存储报警数据;所述地址库用于构建GIS地址库;所述分词工具用于对关键词进行自动分词;所述搜索引擎用于将分词结果进行匹配,并计算匹配度;所述比较判断单元用于设置阈值,将匹配度与阈值进行比较,并大于阈值的报警信息则提示为可能重复报警信的信息。作为优选的,所述重复报警模块还包括一显示单元,用于显示识别为可能重复报警的报警信息。与现有技术相比,本专利技术的有益效果在于:本专利技术结合GIS地址库,分词匹配赋予事发地址地图坐标,而不依赖于报警人必须提供GPS坐标信息,根据事发各要素计算当前报警信息与历史报警信息的匹配度与阈值的比较,给接警员提供是否为重复警情的有效参考,能够有效的识别是否为重复警情,提高接处警效率。附图说明图1为本专利技术实施例的方法流程图;图2为本专利技术实施例系统结构框图。具体实施方式下面结合附图和实施例对本专利技术所述的一种基于搜索引擎的重复报警识别方法和系统作进一步说明。以下是本专利技术所述的一种基于搜索引擎的重复报警识别方法和系统的最佳实例,并不因此限定本专利技术的保护范围。图1示出了一种基于搜索引擎的重复报警识别方法,包括以下步骤:S1、构建GIS(Geographic Information System,,地理信息系统)地址库;在本实施例中,GIS地址库数据来源有以下几种方式:公安标准地址库、高德或其他GIS厂家地址库、自主学习的地址,根据事发地址人工定位后自动归入地址库。S2、设定事发要素权重值及重复报警阈值;S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算Δt时期内覆盖半径范围内的报警信息;S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。分词工具可选择HTTPCWS、IKAnalyzer等。搜索引擎,也有多种可以选择,如Solr、Elasticsearch等作为优选的,在步骤S2中,所述事发要素包括事发地址、事发时间、事发类型、报警人姓名、报警人电话、报警描述。作为优选的,所述步骤S3具体包括:将事发地址进行分词,并通过搜索引擎将分词结果与GIS地址库地址进行匹配,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标。作为优选的,所述步骤S4中,事发地址坐标经纬度(lon,lat),待查询的事发地址坐标经纬度(x,y),事发时间t1,待查询的事发时间t2,一定时期范围Δt,计算满足条件的历史报警信息。一定时期Δt内覆盖半径范围内的报警信息满足的条件为:t1—t2<Δt(lon—x)2+(lat—y)2<r2(距离转换为经纬度单位)。作为优选的,所述步骤S2中,根据事发要素属性及批量数据实验确定各要素权重值(v1,v2,v3...vN),阈值Vmin。作为优选的,所述步骤S5具体包括:将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,得到各要素匹配度(m1,m2,m3...mN),与每条报警信息匹配度(v1*m1,v2*m2,v3*m3...vN*mN),匹配度与阈值Vmin进行比较,大于Vmin的报警信息则提示为可能重复报警。作为优选的,所述事发各要素匹配度计算报警信息匹配度与阈值比较的过程包括:v1*m1+v2*m2+v3*m3...+vN*mN>Vmin;其中各要素匹配度(m1,m2,m3...mN)值的获取是基于搜索引擎对各要素分词后的结果进行计算得到。作为优选的,还包括步骤S6:将当前报警信息与识别的重复报警信息对比展示,进行人工二次确认。图2本文档来自技高网...

【技术保护点】
一种基于搜索引擎的重复报警识别方法,其特征在于,包括以下步骤:S1、构建GIS地址库;S2、设定事发要素权重值及重复报警阈值;S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算Δt时期内覆盖半径范围内的报警信息;S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。

【技术特征摘要】
1.一种基于搜索引擎的重复报警识别方法,其特征在于,包括以下步骤:S1、构建GIS地址库;S2、设定事发要素权重值及重复报警阈值;S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算Δt时期内覆盖半径范围内的报警信息;S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。2.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,在步骤S2中,所述事发要素包括事发地址、事发时间、事发类型、报警人姓名、报警人电话、报警描述。3.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,所述步骤S3具体包括:将事发地址进行分词,并通过搜索引擎将分词结果与GIS地址库地址进行匹配,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标。4.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,所述步骤S4中,一定时期Δt内覆盖半径范围内的报警信息满足的条件为:事发时间t1—待查询的事发时间t2<Δt(事发地址坐标经度lon—待查询的事发地址坐标经度x)2+(事发地址坐标纬度lat—待查询的事发地址坐标纬度y)2<事发地址覆盖范围半径r2(距离转换为经纬度单位)。5.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,所述步骤S2中,根据事发要素属性及批量数据实验确定各要素权重值(v1...

【专利技术属性】
技术研发人员:李小龙杨波贺珊张雪琼
申请(专利权)人:武汉烽火众智数字技术有限责任公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1