【技术实现步骤摘要】
地图信息点的别名获取方法及装置
本专利技术涉及数据处理
,具体涉及一种地图信息点的别名获取方法及装置。
技术介绍
随着计算机技术的不断发展,信息的获取变得极为容易,人们仅需要在搜索栏中输入搜索词即可完成信息的查询。地图检索中,地图上的银行、景点、公司、医院、政府机构、餐馆、商场都是POI(PointofInformation,信息点)点,用户在进行搜索时,搜索词通常为POI的名称或者别名,比如说针对于“北京大学”这个POI,用户检索的时候可能会通过搜索词“北京大学”来进行检索,更普遍的可能是通过搜索词“北大”这个别名来进行检索。再比如地方的工商管理局,如:北京市工商管理局,用户搜索时候可能直接使用简称搜索词“北京市工商局”进行搜索,这其实也是“北京市工商管理局”的一个别名。由此可知,地图信息点的别名是否丰富、是否准确对检索质量的影响是非常大的。但是,专利技术人在实现本专利技术的过程中发现:现有技术中地图信息点的别名是比较单一的,并且不能保证地图信息点的别名的准确性,缺乏一种有效挖掘地图信息点的别名的机制。 >
技术实现思路
...
【技术保护点】
1.一种地图信息点的别名获取方法,包括:/n对预设历史时间段内的搜索日志数据进行分析处理,得到各个搜索词以及通过所述各个搜索词点击的各个搜索结果;/n针对于每一个搜索词,对通过该搜索词点击各个搜索结果的次数进行统计处理;/n根据各个搜索结果的点击次数统计结果,确定该搜索词的有效搜索结果,并记录该搜索词与其有效搜索结果的有效对应关系;/n针对于每一个搜索结果,根据与该搜索结果存在有效对应关系的各个搜索词确定搜索词集合;/n从搜索词集合中查找包含地图信息点的名称的目标搜索词集合,根据目标搜索词集合中包含的其它搜索词确定地图信息点的目标别名。/n
【技术特征摘要】
1.一种地图信息点的别名获取方法,包括:
对预设历史时间段内的搜索日志数据进行分析处理,得到各个搜索词以及通过所述各个搜索词点击的各个搜索结果;
针对于每一个搜索词,对通过该搜索词点击各个搜索结果的次数进行统计处理;
根据各个搜索结果的点击次数统计结果,确定该搜索词的有效搜索结果,并记录该搜索词与其有效搜索结果的有效对应关系;
针对于每一个搜索结果,根据与该搜索结果存在有效对应关系的各个搜索词确定搜索词集合;
从搜索词集合中查找包含地图信息点的名称的目标搜索词集合,根据目标搜索词集合中包含的其它搜索词确定地图信息点的目标别名。
2.根据权利要求1所述的方法,其中,所述从搜索词集合中查找包含地图信息点的名称的目标搜索词集合,根据目标搜索词集合中包含的其它搜索词确定地图信息点的目标别名进一步包括:
从搜索词集合中查找包含地图信息点的名称的目标搜索词集合;
将目标搜索词集合划分为主名称子集和别名称子集,其中主名称子集包含与地图信息点的名称一致的搜索词,别名称子集包含除了地图信息点的名称以外的其它搜索词。
3.根据权利要求2所述的方法,其中,所述主名称子集包含的搜索词有多个,所述方法进一步包括:
根据搜索词的热度信息对所述主名称子集中的各个搜索词进行评分;
根据所述主名称子集中的各个搜索词的热度得分从所述主名称子集中选取出地图信息点的目标名称;
从所述别名称子集中选取出地图信息点的目标别名。
4.根据权利要求1所述的方法,其中,所述各个搜索结果的点击次数统计结果包括:各个搜索结果的点击率;
则所述根据各个搜索结果的点击次数统计结果,确定该搜索词的有效搜索结果具体包括:
判断最高的点击率是否超过预设点击率阈值;和/或,判断最高的点击率是否超过第二高的点击率和第三高的点击率之和;
若是,则确定所述最高的点击率对应的搜索结果为该搜索词的有效搜索结果。
5.一种地图信息点的别名获取装置,包括:
数据处理模块,适于对预设历史时间段内的搜索日志数据进行分析处理,得到各个搜索词以及通过所述各个搜索词点击的各个搜索结果;
统计处理模块,适于针对于...
【专利技术属性】
技术研发人员:明瑞刚,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。