确定兴趣点相似度的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:22641694 阅读:22 留言:0更新日期:2019-11-26 16:10
本申请涉及一种确定兴趣点相似度的方法、装置、计算机设备和存储介质,所述方法包括:获取两个待匹配兴趣点的兴趣点信息;基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵;基于两个待匹配兴趣点之间的匹配矩阵,确定两个待匹配兴趣点之间的相似度。本申请提供的方案可以实现端到端,提高预测结果的准确性。

Methods, devices, computer equipment and storage media for determining similarity of interest points

The application relates to a method, device, computer device and storage medium for determining the similarity of interest points, the method comprises: obtaining the information of interest points of two interest points to be matched; determining the matching matrix between two interest points to be matched based on the information of interest points; determining the similarity between two interest points to be matched based on the matching matrix between two interest points to be matched Degree. The scheme provided by the application can realize end-to-end and improve the accuracy of prediction results.

【技术实现步骤摘要】
确定兴趣点相似度的方法、装置、计算机设备和存储介质
本申请涉及电子地图
,特别是涉及一种确定兴趣点相似度的方法、装置、计算机设备和存储介质。
技术介绍
在地理信息系统中,POI(PointofInterest,兴趣点)代表地图上的任意一个点,例如一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。POI的属性信息通常包括名称、地址、类别等数据,这些数据的来源可以有多个,如现场采集、网络抓取等,不同来源的数据在格式、文字描述等方面往往存在差异,从而在地图数据库中针对同一个POI可能存储有多条数据,导致数据冗余。为了保证POI数据的单一性,通常会判断POI数据的相似度,再根据相似度进行去重。传统方法采用浅层机器学习模型加规则来预测两个POI的相似度,在利用模型进行预测前,需要构建大量特征工程,建立不同场景的多种规则,对两个POI在每个维度是否相似进行初步判断,再利用模型对初步判断结果进行综合预测,该方法存在特征提取和规则调测难度大的问题。
技术实现思路
基于此,有必要针对传统方法的特征提取和规则调测难度大的技术问题,提供一种确定兴趣点相似度的方法、装置、计算机设备和存储介质。一种确定兴趣点相似度的方法,所述方法包括:获取两个待匹配兴趣点的兴趣点信息;基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵;基于两个所述待匹配兴趣点之间的所述匹配矩阵,确定两个所述待匹配兴趣点之间的相似度。一种确定兴趣点相似度的装置,所述装置包括:获取模块,用于获取两个待匹配兴趣点的兴趣点信息;匹配模块,用于基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵;确定模块,用于基于两个所述待匹配兴趣点之间的所述匹配矩阵,确定两个所述待匹配兴趣点之间的相似度。一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:获取两个待匹配兴趣点的兴趣点信息;基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵;基于两个所述待匹配兴趣点之间的所述匹配矩阵,确定两个所述待匹配兴趣点之间的相似度。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:获取两个待匹配兴趣点的兴趣点信息;基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵;基于两个所述待匹配兴趣点之间的所述匹配矩阵,确定两个所述待匹配兴趣点之间的相似度。上述确定兴趣点相似度的方法、装置、计算机可读存储介质和计算机设备,获取两个待匹配兴趣点的兴趣点信息;基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵;基于两个待匹配兴趣点之间的匹配矩阵,确定两个待匹配兴趣点之间的相似度。其中,匹配矩阵反映的是两个兴趣点的各类信息的匹配情况,直接基于匹配情况确定两个兴趣点的相似度,而无需采用复杂的规则对两个兴趣点各类信息的匹配程度进行预先判断,再对预先判断结果进行综合预测,从而可以略去规则及特征工程繁琐的调测,减少人工干预对于最终预测结果的影响,实现端到端,提高预测结果的准确性。附图说明图1为一个实施例中确定兴趣点相似度的方法的应用环境图;图2为一个实施例中确定兴趣点相似度的方法的流程示意图;图3为一个实施例中基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵步骤的流程示意图;图4为一个实施例中基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵步骤的流程示意图;图5为一个实施例中基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵步骤的流程示意图;图6为一个实施例中基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵步骤的流程示意图;图7为一个实施例中基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵步骤的流程示意图;图8为一个实施例中基于兴趣点信息,确定两个待匹配兴趣点之间的匹配矩阵步骤的流程示意图;图9为一个实施例中胶囊网络的结构示意图;图10为一个实施例中对各类型匹配矩阵进行分析,获得两个待匹配兴趣点之间的相似度步骤的流程示意图;图11为一个实施例中训练获得已训练胶囊网络步骤的流程示意图;图12为一个实施例中确定兴趣点相似度的装置的结构框图;图13为一个实施例中确定兴趣点相似度的装置的结构框图;图14为一个实施例中确定兴趣点相似度的装置的结构框图;图15为一个实施例中确定兴趣点相似度的装置的结构框图;图16为一个实施例中计算机设备的结构框图;图17为一个实施例中计算机设备的结构框图。具体实施方式人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本申请涉及人工智能中的机器学习,具体涉及胶囊网络,将胶囊网络应用于地图领域,用以对地图上的兴趣点(POI)之间的相似度进行判断。为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。图1为一个实施例中确定兴趣点相似度的方法的应用环境图。如图1所示,该应用环境涉及用户终端110和服务器120,用户终端110和服务器120通过网络连接。用户可以通过用户终端110访问地图服务平台,服务器120可以是该地图服务平台所在的服务器。终端110或者服务器120,可以获取两个待匹配兴趣点的兴趣点信息,并基于该两个待匹配兴趣点的兴趣点信息,判断两个待匹配兴趣点之间的相似度。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成本文档来自技高网...

【技术保护点】
1.一种确定兴趣点相似度的方法,包括:/n获取两个待匹配兴趣点的兴趣点信息;/n基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵;/n基于两个所述待匹配兴趣点之间的所述匹配矩阵,确定两个所述待匹配兴趣点之间的相似度。/n

【技术特征摘要】
1.一种确定兴趣点相似度的方法,包括:
获取两个待匹配兴趣点的兴趣点信息;
基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵;
基于两个所述待匹配兴趣点之间的所述匹配矩阵,确定两个所述待匹配兴趣点之间的相似度。


2.根据权利要求1所述的方法,其特征在于,包括下述各项中的至少一项:
第一项:
所述兴趣点信息包括兴趣点名称,所述匹配矩阵包括名称向量匹配矩阵;
基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵,包括:
分别切分两个所述待匹配兴趣点的兴趣点名称,分别获得各兴趣点名称包含的各分词;
对切分后的各分词进行映射,获得各分词的分词向量;
根据两个所述兴趣点名称包含的各分词对应的分词向量,确定两个所述兴趣点之间的所述名称向量匹配矩阵,所述名称向量匹配矩阵的单元值,为相应的分词向量之间的余弦值;
第二项:
所述兴趣点信息包括兴趣点地址,所述匹配矩阵包括地址匹配矩阵;
基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵,包括:
分别切分两个所述待匹配兴趣点的兴趣点地址,分别获得各兴趣点地址包含的各级地址;
根据两个所述兴趣点名称包含的各级地址,确定两个所述兴趣点之间的所述地址匹配矩阵,所述地址匹配矩阵的单元值,为相应的各级地址之间的编辑距离;
第三项:
所述兴趣点信息包括兴趣点类别,所述匹配矩阵包括类别匹配矩阵;
基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵,包括:
分别切分两个所述待匹配兴趣点的兴趣点类别,分别获得各兴趣点类别包含的各字段类别;
根据两个所述兴趣点类别包含的各字段类别,确定两个所述兴趣点之间的所述类别匹配矩阵,所述类别匹配矩阵的单元值,为相应的各字段类别之间的编辑距离。


3.根据权利要求2所述的方法,其特征在于,还包括下述各项中的至少一项:
第一项:
所述匹配矩阵还包括名称关键词匹配矩阵;
基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵,还包括:
分别根据两个所述待匹配兴趣点的兴趣点名称,分别确定各兴趣点名称包含的关键词以及各关键词的角色类型;
根据两个所述兴趣点名称包含的各关键词及对应的角色类型,确定两个所述兴趣点名称之间的所述名称关键词匹配矩阵,所述名称关键词匹配矩阵的单元值,为相应的关键词之间的编辑距离;
第二项:
所述匹配矩阵还包括注意力匹配矩阵;
基于所述兴趣点信息,确定两个所述待匹配兴趣点之间的匹配矩阵,还包括:
分别切分两个所述待匹配兴趣点的兴趣点名称,分别获得各兴趣点名称包含的各分词;
根据各兴趣点名称切分后的各分词在兴趣点名称词库中的出现频率,获得各分词的分词权重;
根据两个所述兴趣点名称包含的各分词对应的分词权重,确定两个所述兴趣点名称之间的分词权重匹配矩阵,所述分词权重匹配矩阵的单元值,为相应的分词权重的乘积;
根据所述分词权重匹配矩阵和所述名称向量匹配矩阵,得到所述注意力匹配矩阵,所述注意力匹配矩阵的单元值,为所述分词权重匹配矩阵与所述名称向量匹配矩阵中对应的单元值的乘积;

【专利技术属性】
技术研发人员:岳大威
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1