The invention provides a device and method to weight determination method and device, the same information points, including the determination method of the same information: obtaining the first information point data and information of second data points; according to the first data point information and the second information point data, obtaining the the first information and the second information points of the physical distance and edit distance; through the physical distance, as well as the default edit distance determination strategy determines that the first information and the second information point is the same information point. The geographical location is very close to, concentrated in the same area, information and semantic information two represent the same place that refer to the same entity to determine the same information, provide the basis for the merger of information points, thus making the storage capacity information database of the combined reduction, improve the efficiency of access to information data, is the basis for the input specification information in the application of pad point.
【技术实现步骤摘要】
相同信息点的判定方法及装置、信息点的去重方法及设备
本专利技术涉及信息点合并
,尤其涉及一种相同信息点的判定方法及装置、信息点的去重方法及设备。
技术介绍
随着地理信息系统的发展和完善,电子地图的设计开发技术也日趋成熟。电子地图中,有一类数据被称为信息点(PointofInterest,POI),是指人们感兴趣的数据,如餐馆、公园、商场等建筑物信息,或是一些街道信息等等。通常,POI数据主要包括名称、类别、坐标(如经纬度)、地址、电话、邮编等等信息。POI数据是电子地图中最重要的元素之一,也是人们使用电子地图时最为关注的信息。电子地图通常包含很多的POI数据,这些POI数据涵盖了该地图范围内的绝大部分地理信息,在汽车导航、生活搜索等领域具有广泛的应用。目前,由于在信息点采集时,有的信息点的名称采用简化名称,例如“北京八中”,而有的信息点的名称为完整名称,例如“北京市第八中学”,实际上这两个信息点为相同信息点,但是由于名称不同,人们在信息点搜索,如导航搜索时可能会出现很多关于与搜索关键词对应的信息点的名称,大量的信息点数据降低了搜索效率。
技术实现思路
针对现有技术中的缺陷,本公开提供了一种相同信息点的判定方法及装置、信息点的去重方法及设备,通过判定相同信息点以及将相同信息点进行合并,减少了信息点数据库的存储容量,提高了获取信息点数据的效率。第一方面,本公开提供了一种相同信息点的判定方法,包括:获取第一信息点的数据和第二信息点的数据;根据所述第一信息点的数据和第二信息点的数据,获取所述第一信息点和所述第二信息点的物理距离和编辑距离;通过所述物理距离、编辑距 ...
【技术保护点】
一种相同信息点的判定方法,其特征在于,包括:获取第一信息点的数据和第二信息点的数据;根据所述第一信息点的数据和第二信息点的数据,获取所述第一信息点和所述第二信息点的物理距离和编辑距离;通过所述物理距离、编辑距离以及预设判定策略判定所述第一信息点与所述第二信息点是否为相同信息点。
【技术特征摘要】
1.一种相同信息点的判定方法,其特征在于,包括:获取第一信息点的数据和第二信息点的数据;根据所述第一信息点的数据和第二信息点的数据,获取所述第一信息点和所述第二信息点的物理距离和编辑距离;通过所述物理距离、编辑距离以及预设判定策略判定所述第一信息点与所述第二信息点是否为相同信息点。2.根据权利要求1所述的方法,其特征在于,在获取所述第一信息点和所述第二信息点的物理距离和编辑距离之后,所述方法还包括:将所述编辑距离进行归一化处理,归一化的范围为[0,1]。3.根据权利要求2所述的方法,其特征在于,通过所述物理距离、编辑距离以及预设判定策略判定所述第一信息点与所述第二信息点是否为相同信息点,包括:将所述物理距离与预设第一距离进行比较,归一化后的所述编辑距离与预设第二距离进行比较,根据比较结果,判定所述第一信息点与所述第二信息点是否为相同信息点。4.根据权利要求3所述的方法,其特征在于,所述根据比较结果,判定所述第一信息点与所述第二信息点是否为相同信息点,包括:在所述物理距离小于等于预设第一距离,且归一化后的所述编辑距离小于等于预设第二距离时,判定所述第一信息点和所述第二信息点为相同信息点。5.一种相同信息点的判定装置,其特征在于,包括:数据获取模块,用于获取第一信息点的数据和第二信息点的数据;距离获取模块,用于根据所述第一信息点的数据和第二信息...
【专利技术属性】
技术研发人员:张凌宇,
申请(专利权)人:滴滴中国科技有限公司,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。