信息点识别方法、装置及电子设备制造方法及图纸

技术编号:27413159 阅读:13 留言:0更新日期:2021-02-21 14:28
本申请公开了信息点识别方法、装置及电子设备,涉及深度学习技术领域。具体实现方案为:获取第一相似度特征和第二相似度特征;其中,所述第一相似度特征用于表征第一信息点与第二信息点的文本语义相似度,所述第二相似度特征用于表征所述第一信息点与第二信息点在N维度上的N个相似度,N为大于1的正整数;将所述第一相似度特征和第二相似度特征进行融合,得到目标特征;基于所述目标特征,确定所述第一信息点与第二信息点是否为同一信息点。根据本申请的技术,解决了信息点识别技术存在的识别准确率比较低的问题,提高了信息点识别的准确率。率。率。

【技术实现步骤摘要】
信息点识别方法、装置及电子设备


[0001]本申请涉及智能搜索
,尤其涉及深度学习
,具体涉及一种信息点识别方法、装置及电子设备。

技术介绍

[0002]信息点识别技术指的是通过信息点对应的多维特征判定两个信息点是否属于同一空间实体。其广泛应用于信息点数据上线、信息点数据去重、信息点优质基础属性补充、信息点预定服务和优质内容属性补充等场景,是地图内容生态最核心的基础技术之一。
[0003]目前,信息点识别方式主要是分两个阶段进行信息点识别,第一阶段为计算两个信息点的文本语义相似度,第二阶段为基于这两个信息点的文本语义相似度以及其他维度上的相似度判定这两个信息点是否属于同一空间实体。

技术实现思路

[0004]本公开提供了一种信息点识别方法、装置及电子设备。
[0005]根据本公开的第一方面,提供了一种信息点识别方法,包括:
[0006]获取第一相似度特征和第二相似度特征;其中,所述第一相似度特征用于表征第一信息点与第二信息点的文本语义相似度,所述第二相似度特征用于表征所述第一信息点与第二信息点在N维度上的N个相似度,N为大于1的正整数;
[0007]将所述第一相似度特征和第二相似度特征进行融合,得到目标特征;
[0008]基于所述目标特征,确定所述第一信息点与第二信息点是否为同一信息点。
[0009]根据本公开的第二方面,提供了一种信息点识别装置,包括:
[0010]获取模块,用于获取第一相似度特征和第二相似度特征;其中,所述第一相似度特征用于表征第一信息点与第二信息点的文本语义相似度,所述第二相似度特征用于表征所述第一信息点与第二信息点在N维度上的N个相似度,N为大于1的正整数;
[0011]融合模块,用于将所述第一相似度特征和第二相似度特征进行融合,得到目标特征;
[0012]确定模块,用于基于所述目标特征,确定所述第一信息点与第二信息点是否为同一信息点。
[0013]根据本公开的第三方面,提供了一种电子设备,包括:
[0014]至少一个处理器;以及
[0015]与至少一个处理器通信连接的存储器;其中,
[0016]存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中的任一项方法。
[0017]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行第一方面中的任一项方法。
[0018]根据本申请的技术解决了信息点识别技术存在的识别准确率比较低的问题,提高
了信息点识别的准确率。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0021]图1是根据本申请第一实施例的信息点识别方法的流程示意图;
[0022]图2是信息点识别方法的实现框架示意图;
[0023]图3是地址相似度的计算框架示意图;
[0024]图4为文本语义匹配网络的框架示意图;
[0025]图5是根据本申请第二实施例的信息点识别装置的结构示意图;
[0026]图6是用来实现本申请实施例的信息点识别方法的电子设备的框图。
具体实施方式
[0027]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0028]第一实施例
[0029]如图1所示,本申请提供一种信息点识别方法,包括如下步骤:
[0030]步骤S101:获取第一相似度特征和第二相似度特征;其中,所述第一相似度特征用于表征第一信息点与第二信息点的文本语义相似度,所述第二相似度特征用于表征所述第一信息点与第二信息点在N维度上的N个相似度,N为大于1的正整数。
[0031]本实施例中,信息点识别方法涉及智能搜索
,尤其涉及深度学习
,其可以应用于电子设备,该电子设备可以为服务器,也可以为终端,这里不做具体限定。
[0032]在一些应用场景中,信息点识别技术可以称之为信息点链指技术,其可以广泛应用于信息点数据上线、信息点数据去重、信息点优质基础属性补充、信息点预定服务和优质内容属性补充等场景。其具体应用是基于一信息点从地图系统中链指即链接到与之相同的信息点,或者链接到与之不同的信息点,以进行相应的处理。
[0033]比如,在信息点数据上线的应用场景,目标信息点在数据上线之前,可以判定地图系统中是否存在与之相同的信息点,具体的,可以将目标信息点与地图系统中的每个信息点进行匹配,以判定地图系统中是否存在与之相同的信息点。
[0034]在地图系统中链指到与之相同的信息点的情况下,可以不对其进行重新收录,而在地图系统中链指到与之不同的信息点的情况下,对其进行收录。另外,在地图系统中链指到与目标信息点相同的信息点的情况下,可以针对目标信息点的属性内容,对地图系统中与之相同的信息点的属性内容进行补充,如补充信息点的多媒体内容,以丰富地图系统中信息点的属性内容。
[0035]又比如,可以对线上数据进行查重,针对地图系统中收录的信息点,可以进行信息点识别,以进行信息点查重。
[0036]还比如,可以针对目标信息点从地图系统中召回与之相同或相似的信息点,以实现用户搜索功能。
[0037]在步骤S101中,所述第一信息点和第二信息点为两个信息点,其可以称之为兴趣点,在地理信息系统中,一个信息点可以是一栋房子、一个商铺、一个邮筒、一个公交站或一个景点等。
[0038]所述第一信息点和第二信息点均可以为地图系统中的信息点。在一些应用场景中,所述第一信息点和所述第二信息点也可以为一信息点为地图系统中的信息点,另一信息点不为地图系统中的信息点,其具体应用是针对目标信息点(该信息点可以不为地图系统中的信息点),与地图系统中的信息点(可以称之为待匹配信息点)进行匹配,判定目标信息点和待匹配信息点是否为同一信息点,以进行相应的处理。
[0039]在所述第一信息点和所述第二信息点为一信息点为地图系统中的信息点,另一信息点不为地图系统中的信息点的应用场景中,所述第一信息点可以为目标信息点,而第二信息点可以为地图系统中的待匹配信息点。所述第一信息点也可以为地图系统中的待匹配信息点,而第二信息点也可以为目标信息点。以下实施例中,将以所述第一信息点为目标信息点,所述第二信息点为地图系统中的待匹配信息点为例进行说明。
[0040]所述第一相似度特征用于表征第一信息点与第二信息点的文本语义相似度,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息点识别方法,包括:获取第一相似度特征和第二相似度特征;其中,所述第一相似度特征用于表征第一信息点与第二信息点的文本语义相似度,所述第二相似度特征用于表征所述第一信息点与第二信息点在N维度上的N个相似度,N为大于1的正整数;将所述第一相似度特征和第二相似度特征进行融合,得到目标特征;基于所述目标特征,确定所述第一信息点与第二信息点是否为同一信息点。2.根据权利要求1所述的方法,其中,N大于2,获取第二相似度特征,包括:获取所述第一信息点与第二信息点在N维度上的N个相似度;获取表征每个维度上的相似度的特征信息;将表征所述N个相似度的多个特征信息进行融合,得到所述第二相似度特征。3.根据权利要求2所述的方法,其中,所述N个相似度中包括所述第一信息点与第二信息点在距离维度上的空间相似度,获取所述第一信息点与第二信息点在距离维度上的空间相似度,包括:获取所述第一信息点对应的第一召回距离,所述第二信息点对应的第二召回距离,以及所述第一信息点与第二信息点之间的目标距离;基于所述第一召回距离和所述第二召回距离,对所述目标距离进行归一化,得到所述空间相似度。4.根据权利要求3所述的方法,其中,获取表征所述距离维度上的空间相似度的特征信息,包括:基于预设离散化步长确定所述空间相似度对应的离散化参数;基于所述离散化参数,确定表征所述空间相似度的特征信息。5.根据权利要求1所述的方法,其中,获取第一相似度特征,包括:获取所述第一信息点的第一名称信息和所述第二信息点的第二名称信息;将所述第一名称信息和第二名称信息输入至文本语义匹配网络;其中,所述文本语义匹配网络包括相互对称的第一子网络和第二子网络,所述第一子网络用于采用注意力机制对所述第一信息点进行特征提取,得到所述第一信息点的文本语义特征,所述第二子网络用于采用注意力机制对所述第二信息点进行特征提取,得到所述第二信息点的文本语义特征;基于所述第一信息点的文本语义特征和第二信息点的文本语义特征,输出所述第一相似度特征。6.一种信息点识别装置,包括:获取模块,用于获取第一相似度特征和第二相似度特征;其中,所述第一相似度特征用于表征第一信息点与第二信息点的文本语义相似度,所述第二相似度特征用于表征所述第一信息点与第二信息点在N维度上的N个相似度,...

【专利技术属性】
技术研发人员:谢红伟宿玲玲
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1