信息过滤方法和装置制造方法及图纸

技术编号:34460611 阅读:58 留言:0更新日期:2022-08-06 17:20
本公开提供了信息过滤方法和装置,涉及计算机技术领域,具体涉及数据处理技术领域与人工智能技术领域。具体实现方案为:首先响应于获取到多个待过滤兴趣点,对多个待过滤兴趣点的兴趣点信息进行文本解析,得到多个待过滤兴趣点对应的兴趣点解析结果,然后基于多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出多个待过滤兴趣点对应的地图检索结果,最后基于多个待过滤兴趣点对应的兴趣点解析结果和地图检索结果,对多个待过滤兴趣点进行过滤处理,得到多个待过滤兴趣点对应的过滤结果,可以对待过滤兴趣点的兴趣点信息进行文本解析和地图检索,提高了兴趣点过滤的准确性。提高了兴趣点过滤的准确性。提高了兴趣点过滤的准确性。

【技术实现步骤摘要】
信息过滤方法和装置


[0001]本公开涉及计算机
,具体涉及数据处理
与人工智能
,尤其涉及信息过滤方法和装置。

技术介绍

[0002]在对数据库的兴趣点进行去重过滤过程中,需根据兴趣点信息进行去重归一化,去重系统需要能够区分不同地理位置上具有相同名称的兴趣点,同时还能准确识别同一地理位置上具有相似名称的兴趣点,实现兴趣点的归一化处理。去重归一化难点主要集中在:兴趣点表述多样化(中英、同音、模糊音、相似相近),地理位置信息约束干扰。
[0003]目前去重过滤的做法主要包括2个步骤:1)聚簇分组:对于数据库中的兴趣点记录,基于关键词采用语义相似度计算进行聚簇处理,完成相似兴趣点的数据分组;2)文本相似度去重:采用文本相似度建模技术对每个组内的兴趣点完成去重标记,基于去重标记完成重复兴趣点的过滤。

技术实现思路

[0004]本公开提供了一种信息过滤方法、装置、电子设备、存储介质以及计算机程序产品。
[0005]根据本公开的一方面,提供了一种信息过滤方法,该方法包括:响应于获取到多个待过滤兴趣点,对多个待过滤兴趣点的兴趣点信息进行文本解析,得到多个待过滤兴趣点对应的兴趣点解析结果;基于多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出多个待过滤兴趣点对应的地图检索结果;基于多个待过滤兴趣点对应的兴趣点解析结果和地图检索结果,对多个待过滤兴趣点进行过滤处理,得到多个待过滤兴趣点对应的过滤结果。
[0006]根据本公开的另一方面,提供了一种信息过滤装置,该装置包括:文本解析模块,被配置成响应于获取到多个待过滤兴趣点,对多个待过滤兴趣点的兴趣点信息进行文本解析,得到多个待过滤兴趣点对应的兴趣点解析结果;检索模块,被配置成基于多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出多个待过滤兴趣点对应的地图检索结果;过滤模块,被配置成基于多个待过滤兴趣点对应的兴趣点解析结果和地图检索结果,对多个待过滤兴趣点进行过滤处理,得到多个待过滤兴趣点对应的过滤结果。
[0007]根据本公开的另一方面,提供了一种电子设备,该电子设备包括至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述信息过滤方法。
[0008]根据本公开的另一方面,提供了一种计算机可读介质,其上存储有计算机指令,该计算机指令用于使计算机能够执行上述信息过滤方法。
[0009]根据本公开的另一方面,本申请实施例提供了一种计算机程序产品,其包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述信息过滤方法。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0011]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0012]图1是根据本公开的信息过滤方法的一个实施例的流程图;
[0013]图2是根据本公开的对多个待过滤兴趣点的兴趣点信息进行文本解析的一个实施例的流程图;
[0014]图3是根据本公开的对多个待过滤兴趣点的地址信息进行地址解析的一个实施例的流程图;
[0015]图4是根据本公开的从地图信息中检索出多个待过滤兴趣点对应的地图检索结果的一个实施例的流程图;
[0016]图5是根据本公开的从地图信息中检索出多个待过滤兴趣点对应的初始检索结果的一个实施例的流程图;
[0017]图6是根据本公开的对多个待过滤兴趣点对应的初始检索结果进行筛选的一个实施例的流程图;
[0018]图7是根据本公开的对多个待过滤兴趣点进行过滤处理的一个实施例的流程图;
[0019]图8是根据本公开的信息过滤装置的一个实施例的结构示意图;
[0020]图9是用来实现本公开实施例的信息过滤方法的电子设备的框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]参考图1,图1示出了可以应用于本公开的信息过滤方法的实施例的流程示意图100。该信息过滤方法包括以下步骤:
[0023]步骤110,响应于获取到多个待过滤兴趣点,对多个待过滤兴趣点的兴趣点信息进行文本解析,得到多个待过滤兴趣点对应的兴趣点解析结果。
[0024]在本实施例中,信息过滤方法的执行主体(例如服务器)可以通过网络读取或者接收终端发送的多个待过滤兴趣点,该待过滤兴趣点可以是需要进行过滤去重的一些兴趣点,可以包括一些零售网点的实体店铺,还可以包括一些公园等娱乐场所等等,一些待过滤兴趣点由于一些录入问题或者表述问题,不能够明确是否为同一兴趣点,则需要对这些待过滤兴趣点进行过滤去重,待过滤兴趣点的数量可以是10万、20万等,本公开对此不作具体限定。
[0025]上述执行主体获取到多个待过滤兴趣点后,可以同时获取到多个待过滤兴趣点的兴趣点信息,每个待过滤兴趣点的兴趣点信息可以包括待过滤兴趣点的兴趣点地址信息和兴趣点名称信息等能够表征该待过滤兴趣点的属性信息,该兴趣点信息可以包括文本信息等形式。
[0026]上述执行主体获取到每个待过滤兴趣点的兴趣点信息后,可以分别对每个待过滤兴趣点的兴趣点信息进行文本解析,对兴趣点信息中表征兴趣点地址和兴趣点名称的词语进行分析,提取出每个兴趣点信息中用于表征兴趣点地址和兴趣点名称的词语字段,将每个兴趣点信息中用于表征兴趣点地址和兴趣点名称的词语字段作为待过滤兴趣点对应的兴趣点解析结果。
[0027]可选地,上述执行主体可以通过文心大模型ERNIE模型等语言预训练模型对每个待过滤兴趣点的兴趣点信息进行文本处理,输出每个兴趣点信息中用于表征兴趣点地址和兴趣点名称的词语字段,从而得到每个待过滤兴趣点对应的兴趣点解析结果。
[0028]步骤120,基于多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出多个待过滤兴趣点对应的地图检索结果。
[0029]在本实施例中,上述执行主体获取到多个待过滤兴趣点对应的兴趣点解析结果后,可以进一步获取地图信息,该地图信息可以是包括多个待过滤兴趣点的电子地图信息,可以是包括多个待过滤兴趣点的某个城市的地图信息。
[0030]上述执行主体可以根据兴趣点解析结果在地图信息中进行检索,根据兴趣点解析结果中用于表征兴趣点地址的词语字段,在地图信息中进行检索,确定出地图信息中对应的目标位置。然后上述执行主体可以在目标位置对应的地图信息中进一步根据兴趣点解析结果中用于表征兴趣点名称的词语字段进行检索,确定出目标位置对应的地图信息中与兴趣点名本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息过滤方法,包括:响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的兴趣点信息进行文本解析,得到所述多个待过滤兴趣点对应的兴趣点解析结果;基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的地图检索结果;基于所述多个待过滤兴趣点对应的兴趣点解析结果和所述地图检索结果,对所述多个待过滤兴趣点进行过滤处理,得到所述多个待过滤兴趣点对应的过滤结果。2.根据权利要求1所述的方法,其中,所述兴趣点信息包括所述待过滤兴趣点的地址信息和名称信息;以及,所述响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的兴趣点信息进行文本解析,得到所述多个待过滤兴趣点对应的兴趣点解析结果,包括:响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的地址信息进行地址解析,得到所述多个待过滤兴趣点对应的地址解析结果;对所述多个待过滤兴趣点的名称信息进行名称解析,得到所述多个待过滤兴趣点对应的名称解析结果;将所述多个待过滤兴趣点对应的地址解析结果和名称解析结果确定为所述多个待过滤兴趣点对应的兴趣点解析结果。3.根据权利要求2所述的方法,其中,所述响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的地址信息进行地址解析,得到所述多个待过滤兴趣点对应的地址解析结果,包括:响应于获取到多个待过滤兴趣点,对所述多个待过滤兴趣点的地址信息进行地址解析,获取所述地址信息对应的语义特征和行政特征;基于所述地址信息对应的语义特征和行政特征,生成所述多个待过滤兴趣点对应的地址解析结果。4.根据权利要求1或2所述的方法,其中,所述基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的地图检索结果,包括:基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的初始检索结果;对所述多个待过滤兴趣点对应的初始检索结果进行筛选,得到所述多个待过滤兴趣点对应的地图检索结果。5.根据权利要求4所述的方法,其中,所述兴趣点解析结果包括地址解析结果和名称解析结果;以及,所述基于所述多个待过滤兴趣点对应的兴趣点解析结果,从地图信息中检索出所述多个待过滤兴趣点对应的初始检索结果,包括:基于所述多个待过滤兴趣点对应的地址解析结果,从地图信息中检索出与所述地址解析结果关联的初始位置区域;基于所述多个待过滤兴趣点对应的名称解析结果,从所述初始位置区域对应的地图信息中检索出所述多个待过滤兴趣点对应的初始检索结果。6.根据权利要求4所述的方法,所述初始检索结果包括所述多个待过滤兴趣点对应的多个候选兴趣点和所述多个候选兴趣点的地址信息;以及,所述对所述多个待过滤兴趣点对应的初始检索结果进行筛选,得到所述多个待过滤兴趣点对应的地图检索结果,包括:
基于所述初始检索结果中所述多个候选兴趣点的地址信息,对所述多个待过滤兴趣点对应的初始检索结果进行分组处理,得到多个组别的初始检索结果;针对每个组别的初始检索结果,基于第一筛选规则,对所述初始检索结果中所述多个候选兴趣点进行筛选,得到所述多个候选兴趣点对应的第一筛选结果;基于所述第一筛选结果中候选兴趣点的地址信息和第二筛选规则,对所述第一筛选结果中的候选兴趣点进行筛选,得到所述多个待过滤兴趣点对应的地图检索结果。7.根据权利要求2

6任意一项所述的方法,其中,所述基于所述多个待过滤兴趣点对应的兴趣点解析结果和所述地图检索结果,对所述多个待过滤兴趣点进行过滤处理,得到所述多个待过滤兴趣点对应的过滤结果,包括:将所述多个待过滤兴趣点的地址解析结果进行比对,得到所述多个待过滤兴趣点对应的地址比对结果;将所述多个待过滤兴趣点的名称解析结果进行比对,得到所述多个待过滤兴趣点对应的名称比对结果;将所述多个待过滤兴趣点的地图检索结果进行比对,得到所述多个待过滤兴趣点对应的地图检索比对结果;基于所述多个待过滤兴趣点对应的地址比对结果、名称比对结果和地图检索比对结果,生成所述多个待过滤兴趣点对应的过滤结果。8.一种信息过滤装置,包括:文本解析模块,被配置成响应于获取到多个待过滤兴趣点,...

【专利技术属性】
技术研发人员:周小强余金林黄硕陈永锋何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1