用于数据库构建的系统和方法技术方案

技术编号:24331386 阅读:13 留言:0更新日期:2020-05-29 19:44
本发明专利技术提供了一种数据库构建方法,所述方法包括从第一在线平台获取兴趣点的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据。所述方法进一步包括确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。所述方法进一步包括基于所述兴趣点POI的第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配以及存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。本发明专利技术采用金字塔结构的数据库并从多个线上和线下服务平台抓取POI数据,可提高POI查询的准确度。

System and method for database construction

【技术实现步骤摘要】
用于数据库构建的系统和方法
本申请涉及线上至线下,尤其涉及用于构建数据库的系统和方法。
技术介绍
随着因特网的发展,越来越多的信息可以经由网络从在线服务平台获取和/或检索。例如,用户可以查询存储在运输服务平台的数据库中的感兴趣点POI(pointofinterest,POI)及相关信息。然而,时常地,POI的查询可能是模糊的和不明确的,这可能导致查询的结果不准确。例如,POI的查询可以是短语“美味餐厅”,这对于检索准确地POI太过于模糊。另外,存储在当前数据库中的POI的数据和/或信息可能不全面,其可能无法准确地向用户提供POI的信息。因此,希望提供用于构建能够通过查询检索POI的有效数据库的系统和方法。
技术实现思路
在本专利技术的第一方面,提供了一种数据库构建方法,所述方法包括从第一在线平台获取兴趣点的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据。所述方法进一步包括确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。所述方法进一步包括基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与来自所述至少一组索引标签的至少一个目标索引标签相匹配以及存储所述兴趣点POI的第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。在本专利技术中,所述POI的所述第一特征数据包括所述兴趣点POI的地址、所述兴趣点POI的名称、所述兴趣点POI的坐标、所述兴趣点POI的标签,或所述兴趣点POI的类型中的至少一个。在本专利技术中,所述兴趣点POI的所述第二特征数据包括所述兴趣点POI的评价分数、所述兴趣点POI的消费总次数,或所述兴趣点POI的评价总次数中的至少一个。在本专利技术中,所述第一在线平台用于提供地图服务。在本专利技术中,所述第二在线平台用于提供评价服务。在本专利技术中,可以使用Python技术从所述第二在线平台获取所述兴趣点POI的所述第二特征数据。在本专利技术中,基于所述兴趣点POI的所述第一特征数据将所述兴趣点POI与所述至少一组索引标签中的目标索引标签进行匹配包括:将所述兴趣点POI与所述至少一组索引标签中的其中一组的至少部分索引标签从最高级别到最低级别进行比较;以及基于所述比较确定所述目标索引标签。在本专利技术中,将所述兴趣点POI的所述第一特征数据与至少一组索引标签其中一组的索引标签进行比较包括确定所述兴趣点POI与所述至少一组索引标签的其中一组中的至少部分索引标签之间的相似度;以及确定所述目标索引标签,所述目标索引标签与所述兴趣点POI的相似度满足条件。在本专利技术中,所述方法还包括获取用户通过客户端指定的兴趣点POI的查询;从所述数据库中检索与所述查询匹配的至少一个候选兴趣点POI相关联的数据;以及基于与所述至少一个候选兴趣点POI相关联的所述检索数据,向所述用户推荐所述至少一个候选兴趣点POI中的至少一个。在本专利技术中,基于与所述至少一个候选兴趣点POI相关联的所述检索数据向所述用户推荐所述至少一个候选兴趣点POI中的至少一个包括从所述客户端获取与所述用户相关联的历史数据;以及基于与所述至少一个候选兴趣点POI相关联的所述检索数据和与所述用户相关联的所述历史数据,向所述用户推荐所述至少一个候选POI中的至少一个。在本专利技术的第二方面,提供了一种POI查询方法,所述方法包括获取用户通过客户端指定的兴趣点POI的查询以及从包括至少两个兴趣点POI的数据库中检索与所述查询匹配的至少一个候选POI相关联的数据。所述数据库由以下步骤构建:从第一在线平台获取兴趣点POI的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据;确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配以及存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。所述方法进一步包括基于与所述至少一个候选POI相关联的所述检索数据,向所述用户推荐所述至少一个候选POI中的至少一个。在本专利技术的第三方面,提供了一种处理数据的装置,所述装置包括处理器,所述处理器用于执行上述用于数据库构建和POI查询的方法。在本专利技术的第四方面,提供了一种计算机可读存储介质,所述存储介质存储计算机指令,当所述计算机指令被计算机执行时,计算机运行上述用于数据库构建和POI查询的方法。在本专利技术的第五方面,提供了一种数据库构建的系统。所述系统包括获取模块、确定模块、匹配模块以及存储模块。所述获取模块用于从第一在线平台获取兴趣点POI的第一特征数据以及从第二在线平台获取兴趣点POI的第二特征数据。所述确定模块用于确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括两个级别。所述至少两个级别中的每个级别包括至少一个索引标签。所述匹配模块用于基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配,以及所述存储模块用于存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。本专利技术相对于现有技术,可实现的有益效果包括:(一)本专利技术采用金字塔结构的数据库,设置不同级别的索引标签,可以提高检索速度,便于数据存储和更新;(二)本专利技术通过从多个线上和线下服务平台,例如大众点评,百度地图等抓取兴趣点POI相关数据,可丰富数据库内容,提高POI查询的准确度。本申请的一部分附加特征将在下面的描述中进行说明。通过对以下描述和相应附图的检查或者对实例的生产或操作的了解,本申请的一部分附加特征对本领域技术人员来说是显而易见的。本申请的特征可以通过对以下描述的具体实施例的各个方面的方法、手段及组合的实践或使用得以实现和达到。附图说明本申请通过示例性实施例进一步进行描述。这些示例性实施例将通过附图进行详细描述。附图没有按比例绘制。这些实施例并非限制性的,在这些实施例中,相同的附图标记表示相同的结构,其中:图1是根据本申请的一些实施例所示的示例性数据库系统的示意图;图2是根据本申请的一些实施例所示的可在其上实施处理引擎的示例性计算设备的示例性硬件和/或软件组件的示意图;图3是根据本申请的一些实施例所示的可以在其上实现终端的示例性移动设备的示例性硬件和/或软件组件的示意图;图4是根据本申请所示的一些实施例的示例性终端的框图;图5是根据本申请的一些实施例所示的用于构建数据库的示例性过程的流程图;图6是根据本申请的一些实施例所示的用于向客户终端推荐POI的示例性过程的流程图;图7是根据本申请的一些实施例所示的用于确定目标索引标签的示例性过程的流程图;图8是根据本申请的一些实施例所示的数据库系统的示例性结构的示意图;本文档来自技高网...

【技术保护点】
1.一种数据库构建方法,包括:/n从第一在线平台获取兴趣点POI的第一特征数据;/n从第二在线平台获取所述兴趣点POI的第二特征数据;/n确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别,所述至少两个级别中的每个级别包括至少一个索引标签;/n基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配;以及/n存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。/n

【技术特征摘要】
1.一种数据库构建方法,包括:
从第一在线平台获取兴趣点POI的第一特征数据;
从第二在线平台获取所述兴趣点POI的第二特征数据;
确定至少一组索引标签,所述至少一组索引标签中的每组索引标签包括至少两个级别,所述至少两个级别中的每个级别包括至少一个索引标签;
基于所述兴趣点POI的所述第一特征数据,将所述兴趣点POI与所述至少一组索引标签中的至少一个目标索引标签相匹配;以及
存储所述兴趣点POI的所述第一特征数据、所述第二特征数据、及所述匹配的目标索引标签以形成数据库。


2.根据权利要求1所述的方法,其特征在于,所述POI的所述第一特征数据包括所述兴趣点POI的地址、所述兴趣点POI的名称、所述兴趣点POI的坐标、所述兴趣点POI的标签,或所述兴趣点POI的类型中的至少一个。


3.根据权利要求1或2所述的方法,其特征在于,所述兴趣点POI的所述第二特征数据包括所述兴趣点POI的评价分数、所述兴趣点POI的消费总次数,或所述兴趣点POI的评价总次数中的至少一个。


4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述第一在线平台用于提供地图服务。


5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述第二在线平台用于提供评价服务。


6.根据权利要求1至5中任意一项所述的方法,其特征在于:
使用Python技术从所述第二在线平台获取所述兴趣点POI的所述第二特征数据。


7.根据权利要求1至6中任意一项所述的方法,其特征在于,基于所述兴趣点POI的所述第一特征数据将所述兴趣点POI与所述至少一组索引标签中的目标索引标签进行匹配包括:
将所述兴趣点POI与所述至少一组索引标签中的其中一组索引标签的至少部分索引标签从最高级别到最低级别进行比较;以及
基于所述比较确定所述目标索引标签。


8.根据权利要求7所述的方法,其特征在于,将所述兴趣点POI与至少一组索引标签中的其中一组的至少部分索引标签进行比较包括:
确定所述兴趣点POI与所述至少一组索引标签的其中一组中的至少部分索引标签之间的相似度;以及
确定所述目标索引标签,所述目标索引标签与所述兴趣点POI的相似度满足条件。


9.根据权利要求1至8中任意一项所述的方法,其特征在于,所述方法还包括:
获取用户通过客户端指定的兴趣点POI的查询;
从所述数据库中检索与所述查询匹配的至少一个候选兴趣点POI相关联的数据;以及
基于与所述至少一个候选兴趣点POI相关联的所述检索数据,向所述用户推荐所述至少一个候选兴趣点POI中的至少一个。


10.根据权利要求9所述的方法,其特征在于,基于与所述至少一个候选兴趣点POI相关联的所述检索数据向所述用户推荐所述至少一个候选兴趣点POI中的至少一个包括...

【专利技术属性】
技术研发人员:张凌宇邵琦刘燕叶杰平
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1