【技术实现步骤摘要】
兴趣点POI与检索关键字的相关性分析方法和装置
本专利技术涉及数据分析
,具体涉及兴趣点POI与检索关键字的相关性分析方法和装置。
技术介绍
POI通常是pointofinterest(兴趣点)的缩写,也可以指pointofinformation(信息点)。兴趣点和信息点在地图中可以作为出银行、景点、公司、医院、政府机构、餐馆、商场等的标识。本专利技术中的“兴趣点”和“POI”均指上述含义。在电子地图中可以进行POI检索,例如,用户输入检索关键字,获得与检索关键字相关的POI。因此,如何更准确地分析出检索关键字与POI的相关性是需要解决的问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的兴趣点POI与检索关键字的相关性分析方法和装置。依据本专利技术的一个方面,提供了一种兴趣点POI与检索关键字的相关性分析方法,包括:对所述检索关键字进行分词;对所述POI的一个域,根据分得的各个词计算所述检索关键字与该域的紧密度;根据分得的各个词对该域的命中情况确定第一权重;根据分得的各个词的逆向文件频率idf确定第二权重;根 ...
【技术保护点】
1.一种兴趣点POI与检索关键字的相关性分析方法,包括:对所述检索关键字进行分词;对所述POI的一个域,根据分得的各个词计算所述检索关键字与该域的紧密度;根据分得的各个词对该域的命中情况确定第一权重;根据分得的各个词的逆向文件频率idf确定第二权重;根据所述第一权重、所述第二权重和所述紧密度计算所述检索关键字和所述POI的该域的相关性。
【技术特征摘要】
1.一种兴趣点POI与检索关键字的相关性分析方法,包括:对所述检索关键字进行分词;对所述POI的一个域,根据分得的各个词计算所述检索关键字与该域的紧密度;根据分得的各个词对该域的命中情况确定第一权重;根据分得的各个词的逆向文件频率idf确定第二权重;根据所述第一权重、所述第二权重和所述紧密度计算所述检索关键字和所述POI的该域的相关性。2.如权利要求1所述的方法,其中,所述对所述检索关键字进行分词包括:对获取的检索关键字进行自然语言处理,得到若干个分词对象term;根据该若干个term确定与所述检索关键字的若干个检索标记token,将各token作为所述分得的各个词。3.如权利要求1或2所述的方法,其中,所述根据分得的各个词计算所述检索关键字与该域的紧密度包括:确定与该域命中的token;根据各命中token计算所述检索关键字与该域的紧密度。4.如权利要求1-3中任一项所述的方法,其中,所述根据各命中token计算所述检索关键字与该域的紧密度包括:遍历各命中token,对一个命中token,执行如下步骤:在命中token序列中,计算该命中token与相邻命中token的第一距离,以及在token序列中,计算该命中token与相邻命中token的第二距离,计算所述第一距离和所述第二距离的差的绝对值作为相对距离,根据所述相对距离确定惩罚因子;计算该命中token在该域的idf,对idf进行开方,得到power_idf;将所述power_idf与确定的惩罚因子相乘,得到该命中token与该域的紧密度;所述命中token序列和所述token序列均是按各token在所述检索关键字中的顺序确定的;根据各命中token与该域的紧密度,...
【专利技术属性】
技术研发人员:韩康,唐旺,张绍瑞,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。