The present application discloses a method and device for information retrieval of an interest point. The method includes: receiving the interest point information input by the user, determining the retrieval key words of the interest point information, determining the similarity degree of the information of each interest point in the database according to the keyword searching, and according to the similarity degree of the information of the interest points. Retrieval. Through the above method, the Chinese meaning of the information of the keyword and the database can be accurately expressed by the landmark building, the road name and the community name, and the regular expression, because of the similarity between the retrieval key words and the interest points in the database. Improve the accuracy of information retrieval of interest points.
【技术实现步骤摘要】
一种兴趣点信息检索的方法和装置、及导航设备
本申请涉及电子地图生产
,尤其涉及一种兴趣点(PointofInterest,POI)信息检索的方法及装置。
技术介绍
随着计算机的不断进步和发展,电子地图已经被越来越多的应用到人们的日常生活中,人们可以通过在电子地图获得所需的地理位置信息。目前,为了更好的为用户提供导航服务,会采集大量的兴趣点信息,并将采集到的兴趣点信息添加到在电子地图中,每个兴趣点信息包含名称、地址、电话,坐标等,后续,用户想要去哪个兴趣点,可通过在电子地图输入关键词来检索该兴趣点信息。现有的兴趣点信息检索,首先需要获取用户在地址栏输入的关键词,根据该关键词在数据库中遍历已存储的兴趣点信息,针对每个已存储的兴趣点信息,计算关键词与该兴趣点信息的相似度,将相似度最高的兴趣点信息返回给用户。但是,本专利技术的专利技术人发现:计算关键词与兴趣点信息的相似度是通过编辑距离算法,即,确定将关键词通过增加、删除、替换编辑成与兴趣点信息一致的步骤数,该步骤数即为相似度,步骤数越少相似度越高,反之相似度越低,由于中文表达是以词为基础的,这种算法不适合中文意思的比较,如,假设关键词为邮电局,邮电局与邮政管理局通过编辑距离算法计算出的编辑距离为3,邮电局与水电局通过编辑距离算法计算出的编辑距离为1,会将包含水电局的兴趣点信息返回给用户,而实际上邮电局与邮政管理局指的是同一个意思,因此,现有的兴趣点信息检索的准确率较低。
技术实现思路
有鉴于此,本申请实施例提供一种兴趣点信息检索方法及装置,能够有效的提高兴趣点信息检索的准确率。为解决上述技术问题,本申请实施例公 ...
【技术保护点】
1.一种兴趣点信息检索方法,其特征在于,包括:接收用户输入的兴趣点信息;确定所述兴趣点信息的检索关键词;根据所述检索关键词,计算数据库中的各兴趣点信息的相似度;根据所述各兴趣点信息的相似度,进行兴趣点信息检索。
【技术特征摘要】
1.一种兴趣点信息检索方法,其特征在于,包括:接收用户输入的兴趣点信息;确定所述兴趣点信息的检索关键词;根据所述检索关键词,计算数据库中的各兴趣点信息的相似度;根据所述各兴趣点信息的相似度,进行兴趣点信息检索。2.如权利要求1所述的方法,其特征在于:所述确定所述兴趣点信息的检索关键词进一步包括:对所述兴趣点信息进行预处理,根据词性,对预处理后的兴趣点信息进行分词;根据预设的词语筛选索引表,确定出不包含在所述词语筛选索引表中的分词;根据预设的错别字索引表,对确定出的不包含在所述词语筛选索引表中的分词进行错别字检查,确定所述兴趣点信息的检索关键词。所述对所述兴趣点信息进行预处理进一步包括:去除所述兴趣点信息的特殊符号;将所述兴趣点信息的字体转换成预设的字体。3.如权利要求1所述的方法,其特征在于:1)所述兴趣点信息为兴趣点名称时,根据所述检索关键词,计算数据库中的各兴趣点信息的相似度,进一步包括:针对数据库中的每个兴趣点信息,判断所述检索关键词与该兴趣点信息是否相同;若相同,则所述检索关键词与该兴趣点信息的相似度为1;若不同,则判断所述检索关键词与该兴趣点信息是否存在包含关系,并根据预设的正则表达式,判断所述检索关键词与该兴趣点信息的相似度;2)所述兴趣点信息为兴趣点地址时,根据所述检索关键词,计算数据库中的各兴趣点信息的相似度,进一步包括:去除所述兴趣点信息的行政区划;针对数据库中的每个兴趣点信息,判断去除行政区划的检索关键词与该兴趣点信息是否相同;若是,则所述检索关键词与该兴趣点信息的相似度为1;若否,则根据所述检索词与该兴趣点信息中所包含的地标建筑物、道路名或社区名,确定所述检索词与该兴趣点信息的相似度。4.如权利要求3所述的方法,其特征在于,当检索关键词与该兴趣点信息不存在包含关系时,或者当所述检索词和/或该兴趣点信息未包含地标建筑物、道路名和社区名中的任何一个时,所述方法还包括:将所述检索关键词与该兴趣点信息中字符长度短的作为待分词信息,并将所述检索关键词与该兴趣点信息中字符长度长的作为待匹配信息;根据词性,对待分词信息进行分词处理;针对分词处理后的每个分词,将该分词与待匹配信息进行匹配,确定该分词出现在待匹配信息中的个数,确定该分词在待匹配信息中的个数与该分词的字符长度的乘积,并将该乘积作为该分词的子相似度;确定每个分词的子相似度之和,并将之和作为所述检索关键词与该兴趣点信息的相似度。5.如权利要求1-4任一项所述的方法,其特征在于,还包括:根据计算得到兴趣点信息的相似度更新地图数据;将相似度超过预设的阈值的兴趣点信息输出并反馈给用户。6.一种兴趣点信息检索装置,其特征在于,包括:接收模块,用于接收用户输入的兴趣点信息;关键词确定模块,用于确定所述兴趣点信息的检索关键词;相似度确定模块,用于根据所述检索关键词,计算数据库中的各兴趣点信息的相似度;检索模块,用于根据所述各兴趣点信息的相似度,进行兴趣点信息检索。7.如权利要求6所述的装置,其特征在于:所述关键词确定模块进一步用于,对所述兴趣点信息进行预处理,根据词性,对预处理后的兴趣点信息进行分词,根据预设的词语筛选索引表,确定出不包含在所述词语筛选索引表中的分词...
【专利技术属性】
技术研发人员:魏树颖,
申请(专利权)人:北京四维图新科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。