【技术实现步骤摘要】
信息过滤方法和装置
[0001]本公开涉及计算机
,具体涉及数据处理
与人工智能
,尤其涉及信息过滤方法和装置。
技术介绍
[0002]在对数据库的兴趣点进行去重过滤过程中,需根据兴趣点信息进行去重归一化,去重系统需要能够区分不同地理位置上具有相同名称的兴趣点,同时还能准确识别同一地理位置上具有相似名称的兴趣点,实现兴趣点的归一化处理。去重归一化难点主要集中在:兴趣点表述多样化(中英、同音、模糊音、相似相近),地理位置信息约束干扰。
[0003]目前去重过滤的做法主要包括2个步骤:1)聚簇分组:对于数据库中的兴趣点记录,基于关键词采用语义相似度计算进行聚簇处理,完成相似兴趣点的数据分组;2)文本相似度去重:采用文本相似度建模技术对每个组内的兴趣点完成去重标记,基于去重标记完成重复兴趣点的过滤。
技术实现思路
[0004]本公开提供了一种信息过滤方法、装置、电子设备、存储介质以及计算机程序产品。
[0005]根据本公开的一方面,提供了一种信息过滤方法,该方法包括:响应于获取到多个待过滤兴趣点,对多个待过滤兴趣点的兴趣点信息进行文本解析,得到多个待过滤兴趣点对应的兴趣点解析结果;基于多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出多个待过滤兴趣点对应的地图检索结果;基于多个待过滤兴趣点对应的兴趣点解析结果和地图检索结果,对多个待过滤兴趣点进行过滤处理,得到多个待过滤兴趣点对应的过滤结果。
[0006]根据本公开的另一方面,提供了一种信息过滤装置,该装置包括 ...
【技术保护点】
【技术特征摘要】
1.一种信息过滤方法,包括:响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的兴趣点信息进行文本解析,得到所述多个待过滤兴趣点对应的兴趣点解析结果;基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的地图检索结果;基于所述多个待过滤兴趣点对应的兴趣点解析结果和所述地图检索结果,对所述多个待过滤兴趣点进行过滤处理,得到所述多个待过滤兴趣点对应的过滤结果。2.根据权利要求1所述的方法,其中,所述兴趣点信息包括所述待过滤兴趣点的地址信息和名称信息;以及,所述响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的兴趣点信息进行文本解析,得到所述多个待过滤兴趣点对应的兴趣点解析结果,包括:响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的地址信息进行地址解析,得到所述多个待过滤兴趣点对应的地址解析结果;对所述多个待过滤兴趣点的名称信息进行名称解析,得到所述多个待过滤兴趣点对应的名称解析结果;将所述多个待过滤兴趣点对应的地址解析结果和名称解析结果确定为所述多个待过滤兴趣点对应的兴趣点解析结果。3.根据权利要求2所述的方法,其中,所述响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的地址信息进行地址解析,得到所述多个待过滤兴趣点对应的地址解析结果,包括:响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的地址信息进行地址解析,获取所述地址信息对应的语义特征和行政特征;基于所述地址信息对应的语义特征和行政特征,生成所述多个待过滤兴趣点对应的地址解析结果。4.根据权利要求1或2所述的方法,其中,所述基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的地图检索结果,包括:基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的初始检索结果;对所述多个待过滤兴趣点对应的初始检索结果进行筛选,得到所述多个待过滤兴趣点对应的地图检索结果。5.根据权利要求4所述的方法,其中,所述兴趣点解析结果包括地址解析结果和名称解析结果;以及,所述基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的初始检索结果,包括:基于所述多个待过滤兴趣点对应的地址解析结果,从地图信息中检索出与所述地址解析结果关联的初始位置区域;基于所述多个待过滤兴趣点对应的名称解析结果,从所述初始位置区域对应的地图信息中检索出所述多个待过滤兴趣点对应的初始检索结果。6.根据权利要求4所述的方法,所述初始检索结果包括所述多个待过滤兴趣点对应的多个候选兴趣点和所述多个候选兴趣点的地址信息;以及,所述对所述多个待过滤兴趣点对应的初始检索结果进行筛选,得到所述多个待过滤兴趣点对应的地图检索结果,包括:
基于所述初始检索结果中所述多个候选兴趣点的地址信息,对所述多个待过滤兴趣点对应的初始检索结果进行分组处理,得到多个组别的初始检索结果;针对每个组别的初始检索结果,基于第一筛选规则,对所述初始检索结果中所述多个候选兴趣点进行筛选,得到所述多个候选兴趣点对应的第一筛选结果;基于所述第一筛选结果中候选兴趣点的地址信息和第二筛选规则,对所述第一筛选结果中的候选兴趣点进行筛选,得到所述多个待过滤兴趣点对应的地图检索结果。7.根据权利要求2
‑
6任意一项所述的方法,其中,所述基于所述多个待过滤兴趣点对应的兴趣点解析结果和所述地图检索结果,对所述多个待过滤兴趣点进行过滤处理,得到所述多个待过滤兴趣点对应的过滤结果,包括:将所述多个待过滤兴趣点的地址解析结果进行比对,得到所述多个待过滤兴趣点对应的地址比对结果;将所述多个待过滤兴趣点的名称解析结果进行比对,得到所述多个待过滤兴趣点对应的名称比对结果;将所述多个待过滤兴趣点的地图检索结果进行比对,得到所述多个待过滤兴趣点对应的地图检索比对结果;基于所述多个待过滤兴趣点对应的地址比对结果、名称比对结果和地图检索比对结果,生成所述多个待过滤兴趣点对应的过滤结果。8.一种信息过滤装置,包括:文本解析模块,被配置成响应于获取到多个待过滤兴趣点,...
【专利技术属性】
技术研发人员:周小强,余金林,黄硕,陈永锋,何径舟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。