【技术实现步骤摘要】
基于深度学习的兴趣点融合方法、系统、设备及存储介质
[0001]本专利技术涉及自然语言处理领域,具体地说,涉及基于深度学习的兴趣点融合方法、系统、设备及存储介质。
技术介绍
[0002]POI是“Point of Interest”的缩写,中文可以翻译为“兴趣点”。在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。传统的地理信息采集方法需要地图测绘人员采用精密的测绘仪器去获取一个信息点的经纬度,然后再标记下来。正因为POI的采集是一个非常费时费事的工作,对一个地理信息系统来说,POI的数量在一定程度代表着整个系统的价值。每个POI包含四方面信息,名称、类别、坐标、分类,全面的POI讯息是丰富导航地图的必备资讯,及时的POI信息点能提醒用户路况的分支及周边建筑的详尽信息,也能方便导航中查到你所需要的各个地方,选择最为便捷和通畅的道路来进行路径规划,因此,导航地图POI多少状况直接影响到导航的好用程度。POI(兴趣点)是有分类的,有一级类和二级类,每个分类都有相应的行业的代码和名称对应。方便信息采集的
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的兴趣点融合方法,其特征在于,包括以下步骤:将各待检测的兴趣点的经纬度分别编码成一个字符串,得到地理坐标对应的空间索引值,将坐标哈希值相同的兴趣点分别两两组合得到若干候选兴趣点对;提取所述候选兴趣点对中两个候选兴趣点的词汇特征和语义特征,并输入语义识别神经网络预测两个所述候选兴趣点是否为重复关系;以及当符合重复关系,则将两个所述候选兴趣点融合。2.如权利要求1所述的基于深度学习的兴趣点融合方法,其特征在于,所述将各待检测的兴趣点的经纬度分别编码成一个字符串,得到地理坐标对应的空间索引值,将坐标哈希值相同的兴趣点分别两两组合得到若干候选兴趣点对,包括:通过Geohash算法,将每个兴趣点的经纬度编码成一个字符串;根据预设精度截断空间索引值,将坐标哈希值相同的兴趣点分别两两组合得到若干候选兴趣点对。3.如权利要求1所述的基于深度学习的兴趣点融合方法,其特征在于,所述提取所述候选兴趣点对中两个候选兴趣点的词汇特征和语义特征,并输入语义识别神经网络预测两个所述候选兴趣点是否为重复关系,包括:至少基于名称信息、地址信息、介绍文本信息,获得所述候选兴趣点对中两个候选兴趣点的词汇特征的相似参数;获得所述候选兴趣点对中两个候选兴趣点的语义特征的相似参数;将所述词汇特征的相似参数和语义特征的相似参数输入经过训练的逻辑分类器预测两个所述候选兴趣点是否为重复关系。4.如权利要求3所述的基于深度学习的兴趣点融合方法,其特征在于,所述至少基于名称信息、地址信息、介绍文本信息,获得所述候选兴趣点对中两个候选兴趣点的词汇特征的相似参数,包括:对于两个所述候选兴趣点的名称信息,除去预设省份、城市等前缀字段以及预设关键词后缀外,计算所述名称的其余部分的第一杰卡德相似系数f1;对于两个所述候选兴趣点的所述地址信息,除去预设省份、城市、景点名称字段外,计算所述地址信息的其余部分的第二杰卡德相似系数f2;对于两个所述候选兴趣点的所述介绍文本信息进行分词,计算≥4字的短语的第三杰卡德相似系数f3。5.如权利要求4所述的基于深度学习的...
【专利技术属性】
技术研发人员:王子奕,刘嘉伟,鞠剑勋,李健,
申请(专利权)人:携程旅游信息技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。