一种地图数据判重的方法及系统技术方案

技术编号：10683476 阅读：241 留言：0更新日期：2014-11-26 14:55

本发明专利技术提供了一种地图数据判重的方法，包括：依据用户行为日志统计查询词的搜索结果中兴趣点的点击次数，并依据查询词、兴趣点以及点击次数的对应关系生成有向图；依据所述有向图，利用随机游走算法获得兴趣点之间的相似度；当两个兴趣点的相似度大于预设阈值时，判定所述两个兴趣点为重复数据；本发明专利技术还提供一种地图数据判重的系统。根据本发明专利技术提供的技术方案，能够有效识别出电子地图应用中重复的兴趣点。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种地图数据判重的方法，包括：依据用户行为日志统计查询词的搜索结果中兴趣点的点击次数，并依据查询词、兴趣点以及点击次数的对应关系生成有向图；依据所述有向图，利用随机游走算法获得兴趣点之间的相似度；当两个兴趣点的相似度大于预设阈值时，判定所述两个兴趣点为重复数据；本专利技术还提供一种地图数据判重的系统。根据本专利技术提供的技术方案，能够有效识别出电子地图应用中重复的兴趣点。【专利说明】一种地图数据判重的方法及系统【
】本专利技术涉及互联网应用领域，尤其涉及一种地图数据判重的方法及系统。【
技术介绍
】随着地理信息系统(GIS, Geographic Informat1n System)的普及，电子地图中引进了政府机关、观光景点、宾馆、餐厅、商场以及医院等人们感兴趣的地点的名称、简介等数据，这些人们感兴趣的地点称为兴趣点(POI, Point of Interest)。在使用电子地图时，会依据用户输入的query (查询词)向用户提供一个以上兴趣点作为搜索结果，但是由于目前电子地图应用中兴趣点的数据来源比较多也比较杂，导致搜索结果中会出现重复的兴趣点，这样就对用户产生了干扰，当用户无法识别出需要获知的是哪个兴趣点时，就会点击搜索结果中的所有兴趣点，进一步进行人工筛选，因此，为了保证兴趣点的有效性、可靠性以及提高唯一性，必须对兴趣点进行判重处理。目前，对兴趣点进行判重的方法是:从兴趣点的数据出发，如兴趣点的名称、地址和经纬度坐标等，先对兴趣点的名称进行解析，提取名称的核心词，然后依据兴趣点的经纬度坐标，判断附近的兴趣点的名称是...

【技术保护点】
一种地图数据判重的方法，其特征在于，该方法包括：依据用户行为日志统计查询词的搜索结果中兴趣点的点击次数，并依据查询词、兴趣点以及点击次数的对应关系生成有向图；依据所述有向图，利用随机游走算法获得兴趣点之间的相似度；当两个兴趣点的相似度大于预设阈值时，判定所述两个兴趣点为重复数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘凯奎，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人