【技术实现步骤摘要】
一种异常POI数据的检测方法、装置、电子设备及存储介质
[0001]本公开涉及数据处理
,尤其涉及地图数据处理
技术介绍
[0002]由于地图侧数据挂接错误,可能会出现地图中POI(Point of Interest,兴趣点)显示信息错误的问题。如,同一个POI上显示多家酒店的信息,同一家酒店信息显示在多个POI点位等等。
技术实现思路
[0003]本公开提供了一种异常POI数据的检测方法、装置、设备以及存储介质,用于检测异常POI数据。
[0004]根据本公开的一方面,提供了一种异常POI数据的检测方法,包括:
[0005]针对地图中待检测的POI,,针对地图中的各POI,获取数据库中所述POI对应的参考建筑物信息和获取地图中所述POI对应的挂接建筑物信息;
[0006]分别对所述参考建筑物信息以及所述挂接建筑物信息进行分词,得到第一分词结果以及第二分词结果;其中,所述第一分词结果为所述参考建筑物信息和所述挂接建筑物信息中一者的分词结果;所述第二分词结果为所述参考建筑物信息与所述挂接建筑物信息中另一者的分词结果;
[0007]针对所述第一分词结果中的各第一词语,将所述第一词语与所述第二分词结果中的各第二词语进行匹配,得到各所述第一词语的二值化匹配结果,其中,所述二值化匹配结果包括第一预设值和第二预设值,所述第一预设值表示所述第一词语与所述第二词语匹配成功,所述第二预设值表示所述第一词语与所述第二词语未匹配成功;
[0008]若所述第一分词结果中 ...
【技术保护点】
【技术特征摘要】
1.一种异常POI数据的检测方法,包括:针对地图中待检测的POI,获取数据库中所述POI对应的参考建筑物信息和获取地图中所述POI对应的挂接建筑物信息;分别对所述参考建筑物信息以及所述挂接建筑物信息进行分词,得到第一分词结果以及第二分词结果;其中,所述第一分词结果为所述参考建筑物信息和所述挂接建筑物信息中一者的分词结果;所述第二分词结果为所述参考建筑物信息与所述挂接建筑物信息中另一者的分词结果;针对所述第一分词结果中的各第一词语,将所述第一词语与所述第二分词结果中的各第二词语进行匹配,得到各所述第一词语的二值化匹配结果,其中,所述二值化匹配结果包括第一预设值和第二预设值,所述第一预设值表示所述第一词语与所述第二词语匹配成功,所述第二预设值表示所述第一词语与所述第二词语未匹配成功;若所述第一分词结果中存在异常第一词语,则确定所述挂接建筑物信息为异常POI数据,其中,所述异常第一词语为二值化匹配结果均为第二预设值的第一词语。2.根据权利要求1所述的方法,其中,所述针对所述第一分词结果中的各第一词语,将所述第一词语与所述第二分词结果中的各第二词语进行匹配,得到各所述第一词语的二值化匹配结果,包括:基于预设同义词词表,获取所述第二分词结果中的各第二词语的同义词;针对所述第一分词结果中的各第一词语,将所述第一词语与各所述第二词语以及各所述第二词语的同义词进行匹配,得到各所述第一词语的二值化匹配结果,其中,所述二值化匹配结果包括第一预设值和第二预设值,所述第一预设值表示所述第一词语与所述第二词语或所述第二词语的同义词相同,所述第二预设值表示所述第一词语与所述第二词语和所述第二词语的同义词不相同。3.根据权利要求1所述的方法,其中,所述针对所述第一分词结果中的各第一词语,将所述第一词语与所述第二分词结果中的各第二词语进行匹配,得到各所述第一词语的二值化匹配结果,包括:从所述第一分词结果中获取第一词语;针对所述第一词语,从所述第二分词结果中获取第二词语;将所述第二词语与所述第一词语进行匹配;若所述第二词语与所述第一词语匹配成功,则将所述第一词语与所述第二词语的二值化匹配结果确定为第一预设值,若所述第二词语与所述第一词语未匹配成功,则将所述第一词语与所述第二词语的二值化匹配结果确定为第二预设值;从所述第二分词结果中获取新的第二词语,并返回执行所述将所述第二词语与所述第一词语进行匹配的步骤,直至所述第二词语与所述第一词语匹配成功,或,针对所述第一词语所述第二分词结果中的所有第二词语均被获取;从所述第一分词结果中获取新的第一词语,并返回执行所述针对所述第一词语,从所述第二分词结果中获取第二词语的步骤,直至所述第一分词结果中的所有第一词语均被获取。4.根据权利要求3所述的方法,其中,所述针对所述第一词语,从所述第二分词结果中获取第二词语,包括:
针对所述第一词语,从所述第二分词结果的待匹配词语中获取第二词语,其中,所述待匹配词语初始时为第二分词结果中的所有第二词语;所述方法还包括:若所述第二词语与所述第一词语匹配成功,则从所述待匹配词语中删除所述第二词语;所述从所述第二分词结果中获取新的第二词语,并返回执行所述将所述第二词语与所述第一词语进行匹配的步骤,直至针对所述第一词语所述第二分词结果中的所有第二词语均被获取,包括:从所述第二分词结果的待匹配词语中获取新的第二词语,并返回执行所述将所述第二词语与所述第一词语进行匹配的步骤,直至针对所述第一词语所述第二分词结果的待匹配词语中的所有第二词语均被获取。5.根据权利要求1所述的方法,其中,所述分别对所述参考建筑物信息以及所述挂接建筑物信息进行分词,得到第一分词结果以及第二分词结果,包括:基于预设基础词表分别对所述参考建筑物信息以及所述挂接建筑物信息进行分词,得到第一候选分词以及第二候选分词;将所述第一候选分词与第二候选分词与预设停用词表中的词语进行匹配;剔除第一候选分词以及第二候选分词中与预设停用词表中的词语匹配成功的词语,得到第一分词结果以及第二分词结果。6.根据权利要求1所述的方法,所述方法还包括:若所述第一分词结果中的各第一词语的二值化匹配结果均包含所述第一预设值,则确定所述挂接建筑物信息为正常POI数据。7.一种异常POI数据的检测装置,包括:获取模块,用于针对地图中待检测的POI,获取数据库中所述POI对应的参考建筑物信息和获取地图中所述POI对应的挂接建筑物信息;分词模块,用于分别对所述参考建筑物信息以及所述挂接建筑物信息进行分词,得到第一分词结果以及第二分词结果;其中,所述第一分词结果为所述参考建筑物信息和所述挂接建筑物信...
【专利技术属性】
技术研发人员:隆盼,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。