一种查询串语义需求分析方法及装置制造方法及图纸

技术编号:16301315 阅读:28 留言:0更新日期:2017-09-26 19:24
本发明专利技术涉及一种查询串语义需求分析的方法及装置,本发明专利技术实施例提供的方法包括:对接收到的查询串进行分词,获得分词查询串;从查询串所对应的语义模板库中获取匹配分词查询串的候选语义模板;计算候选语义模板的语义评分,将语义评分最高的候选语义模板作为最优语义模板,并根据最优语义模板构造检索方案。本发明专利技术实施例提供的一种查询串语义需求分析的方法及装置,克服了现有技术的不足,通过语义需求分析在更短的时间内为用户提供更为满足用户实际需求的检索方案,检索方案的获取方式灵活简便、速度快、精确度高,从根本上提高了用户体验。

Query string semantic requirement analysis method and device

The invention relates to a method and apparatus for semantic requirement analysis queries, including the method provided by the embodiment of the invention of the received query string segmentation, word segmentation for query string; obtaining matching template query string candidate word meaning semantic template library corresponding to the query string from the candidate semantic semantic score calculation; the template will be the highest scoring candidate semantic semantic template as the optimal semantic template, and according to the semantic retrieval scheme of optimal template construction. A query is an embodiment of the invention provides a method and apparatus on semantic requirement analysis, overcomes the defects of the prior art through semantic requirement analysis in a shorter period of time to provide users with more to meet the actual needs of the user retrieval method, retrieval scheme is simple and flexible way to obtain high speed and high accuracy, fundamentally to improve the user experience.

【技术实现步骤摘要】
一种查询串语义需求分析方法及装置
本专利技术涉及语义分析领域,具体涉及一种查询串语义需求分析方法及装置。
技术介绍
当前,搜索查询已经是人们使用地图产品的重要业务,通过搜索查询,人们可以实现对特定目的地、生活类服务、路途规划的应用需求。其中,对于用户输入的查询串,尤其是占比逐步增大的语音输入的查询串,包含有大量的用户语义需求需要搜索引擎解析。现有技术使用的搜索查询方式较为简单,使用较为简单的匹配规则从关键词词表中获取与用户输入查询串的匹配的关键词,最终根据关键词构造检索方案。但是,现有技术关键词依靠人工枚举获得,使得关键词词表难以全面覆盖用户输入的查询串,且获取匹配的关键词的时间较长。显然,现有技术很难在短时间内根据查询串获取匹配查询串是实际语义需求检索方案。
技术实现思路
第一方面,本专利技术实施例提供了一种查询串语义需求分析方法,该方法包括:对接收到的查询串进行分词,获得分词查询串;从查询串所对应的语义模板库中获取匹配分词查询串的候选语义模板;计算候选语义模板的语义评分,将语义评分最高的候选语义模板作为最优语义模板,并根据最优语义模板构造检索方案。第二方面,本专利技术实施例提供一种查询串语义需求分析系统装置,该系统装置包括:分词模块,用于对接收到的查询串进行分词获得分词查询串;候选语义模板获取模块,用于从所述查询串所对应的语义模板库中获取匹配所述分词查询串的候选语义模板;检索方案构造模块,用于分别计算所述候选语义模板的语义评分,将语义评分最高的所述候选语义模板作为最优语义模板,并根据最优语义模板构造检索方案。本专利技术实施例提供的一种查询串语义需求分析的方法及装置,克服了现有技术的不足,通过语义需求分析在更短的时间内为用户提供更为满足用户实际需求的检索方案,检索方案的获取方式灵活简便、速度快、精确度高,从根本上提高了用户体验。附图说明图1为本专利技术实施例提供的一种查询串语义需求分析的方法流程示意图;图2为本专利技术实施例提供的一种查询串语义需求分析方法的具体流程示意图;图3为本专利技术实施例提供的语义模板库中部分语义模板的存储示意图;图4为本专利技术实施例提供的需求类别示意图;图5为本专利技术实施例提供的黑白名单示意图;图6为本专利技术实施例提供的另一种查询串语义需求分析方法;图7为本专利技术实施例提供的另一种查询串语义需求分析方法;图8为本专利技术实施例提供的一种查询串语义需求分析系统装置;图9为本专利技术实施例提供的一种查询串语义需求分析终端装置。具体实施方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。图1为本专利技术实施例提供的一种查询串语义需求分析的方法流程示意图,如图1所示,该方法的具体步骤包括:步骤S1101,对接收到的查询串进行分词,获得分词查询串;步骤S1102,从查询串所对应的语义模板库中获取匹配分词查询串的候选语义模板;步骤S1103,计算候选语义模板的语义评分,将语义评分最高的候选语义模板作为最优语义模板,并根据最优语义模板构造检索方案。本专利技术实施例提供的一种查询串语义需求分析的方法,克服了现有技术的不足,通过语义需求分析在更短的时间内为用户提供更为满足用户实际需求的检索方案,检索方案的获取方式灵活简便、速度快、精确度高,从根本上提高了用户体验。图2为本专利技术实施例提供的一种查询串语义需求分析方法的具体流程示意图,如图2所示,本方法包括步骤S201-步骤S208:步骤S201,获取查询串及搜索范围,并用搜索范围标记查询串;需要说明的是,搜索范围包括但不限于地理范围(国家、城市、乡镇等)、,由于搜索范围中较为常用的是以某城市为范围展开搜索查询,因此,以搜索范围为城市为例,对本专利技术实施例进行说明。用户上报查询串及搜索范围方式包括:方式一,通过文字输入上报查询串及搜索城市,如:选取搜索城市为“北京”,文字输入“我要去国家图书馆”;方式二,通过语音输入上报查询串及搜索城市,如:选取搜索城市为“北京”,语音输入“我要去国家图书馆“,系统对语音输入内容进行识别获得查询串;当用户仅上报查询串而不上报搜索城市时,则定位当前位置所在城市作为搜索城市或者对查询串进行位置分析获得查询串所对应的搜索城市。步骤S202,判断查询串是否属于黑白名单,当查询串不属于黑白名单时,执行步骤S204,否则执行步骤S203从黑白名单中获取查询串所对应的黑白名单词条,根据该黑白名单词条的语义需求类别构造检索方案;需要说明的是,黑白名单是通过人工线下挖掘获得,黑白名单中包含多个黑白名单词条以及每个黑白名单词条所对应的语义需求类别。举例说明:黑白名单词条“地铁路线图”对应的语义需求类别为“关键词”,则最终获得的检索方案为:为用户提供XX城市的地铁路线图。黑白名单的存在简化了语义需求判断过程,加快了构造检索方案的速度。步骤S204,根据分词规则对地址查询串进行分词处理,获得分词查询串。如:“从望京医院怎么到方恒国际中心啊”,分词后会返回“从/望京医院/怎么到/方恒国际中心/啊”的分词查询串。分词规则即指采用“匹配分词词典”与“消除歧义算法”结合的原理对查询串进行分词,具体的:从分词词典获取与查询串匹配的分词查询串(由词典中的多个分词片段组成),当匹配获得多个分词查询串时,采用消除歧义算法对多个分词查询串进行选择,获取最匹配查询串的分词查询串。步骤S205,获取候选语义模板;确定搜索城市所对应的语义模板库,从语义模板库中获得匹配分词查询串的包括多个模板词的候选语义模板,候选语义模板由模板词和实体词构成。特殊的,当获得的候选语义模板的数量为1时,将该候选语义模板直接作为最优语义模板,并执行步骤S207。本实施例采用AC自动机算法从语义模板库中获得匹配分词查询串的包括多个模板词的候选语义模板,AC自动机算法仅是实现本专利技术实施例的一种手段,并不限制本专利技术。AC自动机(Aho-Corasickautomaton):一种著名的多模匹配算法,该算法在1975年产生于贝尔实验室。该算法通过构建一颗特殊的trie树,使主串可以查找多个模式串。其中,Trie树即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点在于可以最大限度地减少无谓的字符串比较,查询效率比哈希表高。语义模板库可以是一种字典树(因此,也称语义模板库为语义模板树)。该语义模板库由多个模板词组成。在本专利技术实施例中字典树仅是语义模板库的一种实现形式,但并不限定本专利技术。图3为本专利技术实施例提供的语义模板库中部分语义模板的存储示意图,如图3所示,此部分语义模板库中包含语义模板:[D:train_查询]自[W:1-30][D:train_到][W:1-30];[D:train_查询][D:train_附近][D:train_有][W:1-30]吗;[D:train_查询][D:train_附近][D:train_有][W:1-30];[D:train_查询][W:1-30][D:train_公交][D:train_位置];[D:train_出行方式][D:train_到][W:1-30][D:train_怎么];[D:train_出行方式][D:train_起始][D:t本文档来自技高网...
一种查询串语义需求分析方法及装置

【技术保护点】
一种查询串语义分析方法,其特征在于,所述方法包括:对接收到的查询串进行分词,获得分词查询串;从所述查询串所对应的语义模板库中获取匹配所述分词查询串的候选语义模板;分别计算所述候选语义模板的语义评分,将语义评分最高的候选语义模板作为最优语义模板,并根据所述最优语义模板构造检索方案。

【技术特征摘要】
1.一种查询串语义分析方法,其特征在于,所述方法包括:对接收到的查询串进行分词,获得分词查询串;从所述查询串所对应的语义模板库中获取匹配所述分词查询串的候选语义模板;分别计算所述候选语义模板的语义评分,将语义评分最高的候选语义模板作为最优语义模板,并根据所述最优语义模板构造检索方案。2.根据权利要求1所述的方法,其特征在于,从所述查询串所对应的语义模板库中获取匹配所述分词查询串的候选语义模板的步骤,具体包括:获取所述查询串所对应的搜索范围;获取与所述搜索范围对应的所述语义模板库,从所述语义模板库中获取匹配所述分词查询串的候选语义模板。3.根据权利要求2所述的方法,其特征在于,所述搜索范围为搜索城市,所述获取所述查询串所对应的搜索范围的步骤,具体包括:根据当前定位位置获取所述查询串所对应的搜索城市;并且/或者对所述查询串进行位置分析,获取所述查询串所对应的搜索城市。4.根据权利要求1所述的方法,其特征在于,所述从所述查询串所对应的语义模板库中获取匹配所述分词查询串的候选语义模板的步骤,具体还包括:使用AC自动机从语义模板库中获取匹配所述分词查询串的候选语义模板。5.根据权利要求1所述的方法,其特征在于,所述计算所述候选语义模板的语义评分的步骤,具体包括:获取所述候选语义模板中包含的模板词,并获得所述模板词的语义评分,所述模板词的语义评分根据所述模板词的类型以及所述模板词的长度进行设定;对所述候选语义模板中包含的所有模板词的语义评分进行线性加权求和获得求和结果,所述求和结果为所述候选语义模板的语义评分。6.根据权利要求1所述的方法,其特征在于,所述将语义评分最高的候选语义模板作为最优语义模板的步骤,具体包括:根据POI资源库...

【专利技术属性】
技术研发人员:王思聪
申请(专利权)人:高德信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1