The present invention provides a method and apparatus of interest points extracted from the query method includes: segmentation of user input queries, extracting query words contained in the geographical information; geographical information contains a selection of candidate interest points from the query results of segmentation; according to the domain information matching processing candidate interest point selection; successful matching interest points from the candidate points of interest as the query points of interest. According to the invention, the point of interest generally contains geographical information, so the query word extraction and segmentation of geographical information, geographical information can be contained recombinant candidate interest points, the candidate points of interest is limited; then, the candidate points of interest and geographical information with the existing points of interest due to geographical information; the limited number of candidate points of interest, the interest points matching with the existing computing resources will not take up too much at the same time, according to the geographical information to determine the point of interest rate, the accuracy is very high.
【技术实现步骤摘要】
从查询词中提取兴趣点的方法和装置
本专利技术涉及计算机
,具体而言,涉及一种从查询词中提取兴趣点的方法和装置。
技术介绍
当前搜索引擎对查询词的处理过程主要是:分词→查询倒排索引→排序显示。查询词中有很多会涉及到POI(PointofInterest,兴趣点),目前由于问题的多样性和兴趣点数量级的限制,并没有一种恰当的方法针对查询词中的兴趣点进行识别和处理,如果能够将其中的兴趣点识别出来,而兴趣点又自带经纬度和地址,结合这些丰富的信息,能很大程度上提升对查询词语义的理解,对于涉及兴趣点的查询词能够直接丰富其结果维度,从而改善搜索引擎的质量。然而全国有几千万的兴趣点量,将一条查询词和几千万的兴趣点进行匹配显然是一个非常耗时的过程,而且连进行匹配的长度也不确定。因此,需要实现一种能够准确、高效的识别出查询词中所包含的兴趣点信息的技术方案。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的从查询词中提取兴趣点的方法和装置。依据本专利技术的一种从查询词中提取兴趣点的方法,包括:对用户输入的查询词进行分词,提取所述查询词中包含的地域信息;从所述查询词的分词结果中选择包含所述地域信息的候选兴趣点;根据所述地域信息将所述候选兴趣点进行匹配处理;从所述候选兴趣点中选择匹配成功的兴趣点作为所述查询词的兴趣点。可选地,前述的方法,从所述查询词的分词结果中选择包含所述地域信息的候选兴趣点,具体包括:根据用于记载多个前缀以及所述多个前缀所在兴趣点的分词数量的前缀词典,从所述查询词的分词结果中选择分词组成所述候选兴趣点。可选地,前述 ...
【技术保护点】
一种从查询词中提取兴趣点的方法,其特征在于,包括:对用户输入的查询词进行分词,提取所述查询词中包含的地域信息;从所述查询词的分词结果中选择包含所述地域信息的候选兴趣点;根据所述地域信息将所述候选兴趣点进行匹配处理;从所述候选兴趣点中选择匹配成功的兴趣点作为所述查询词的兴趣点。
【技术特征摘要】
1.一种从查询词中提取兴趣点的方法,其特征在于,包括:对用户输入的查询词进行分词,提取所述查询词中包含的地域信息;从所述查询词的分词结果中选择包含所述地域信息的候选兴趣点;根据所述地域信息将所述候选兴趣点进行匹配处理;从所述候选兴趣点中选择匹配成功的兴趣点作为所述查询词的兴趣点。2.根据权利要求1所述的方法,其特征在于,从所述查询词的分词结果中选择包含所述地域信息的候选兴趣点,具体包括:根据用于记载多个前缀以及所述多个前缀所在兴趣点的分词数量的前缀词典,从所述查询词的分词结果中选择分词组成所述候选兴趣点。3.根据权利要求1-2任一项所述的方法,其特征在于,根据所述地域信息将所述候选兴趣点进行匹配处理,具体包括:识别所述候选兴趣点的后缀,并使用去除后缀的所述候选兴趣点进行匹配处理。4.根据权利要求1-3任一项所述的方法,其特征在于,将所述候选兴趣点进行匹配处理,具体包括:根据预设方式对所述候选兴趣点进行计算得到结果值;根据所述候选兴趣点的结果值,从多个容器中选择对应的容器;其中预设多个容器存储多个信息点,且所述多个容器分别采用其中信息点按所述预设方式计算的结果值作为标识;判断所述对应的容器中存储的兴趣点包含的地域信息是否与所述候选兴趣点的所述地域信息相同。5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:如果所述查询词的兴趣点为多个,其中第一兴趣点为第二兴趣点的部分时,从所述查询词的兴趣点中过滤掉所述第一兴趣点。6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:判断所述查询词的兴趣点的含义是否清楚,根据判断结果确认是否保留所述查询词的兴趣点。7.一种从查询词中提取兴...
【专利技术属性】
技术研发人员:马健,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。