查询数据的获取方法、装置及终端制造方法及图纸

技术编号:17797099 阅读:18 留言:0更新日期:2018-04-25 20:37
本发明专利技术公开了一种查询数据的获取方法、装置及终端,涉及互联网技术领域,主要目的在于提高获取查询数据的准确性,同时减少不必要的人工资源开销。本发明专利技术的主要技术方案包括:根据查询关键词提取获取目标查询结果的查询特征;将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵,其中,所述预设查询分类模型用于根据训练样例训练得到每个查询特征对应的最大熵,最大熵的查询特征对应一个查询类别;基于所述最大熵的查询特征与查询类别之间的对应关系,确定所述查询特征的最大熵所对应的查询类别;返回与所述查询关键词属于同一所述查询类别的、且相关的所述目标查询结果。本发明专利技术主要应用于在外卖平台中获取查询数据的过程中。

Retrieval methods, devices and terminals for querying data

The invention discloses a method, device and terminal for obtaining query data, which involves the field of Internet technology. The main purpose of the invention is to improve the accuracy of obtaining the query data and reduce the unnecessary cost of artificial resources. The main technical scheme of the invention includes: extracting the query characteristics of the result of the target query according to the query key words; inputting the query feature into the preset query classification model and obtaining the maximum entropy of the query feature, in which the presupposed query classification model is used to get each lookup according to the training sample. Query feature corresponding to the maximum entropy, the query feature of the maximum entropy corresponds to a query class; based on the corresponding relationship between the query feature of the maximum entropy and the query category, the query category corresponding to the maximum entropy of the query feature is determined; and the query keyword is returned to the same query category and is related to the query keyword. The result of the target query. The invention is mainly applied to the process of acquiring query data in the takeaway platform.

【技术实现步骤摘要】
查询数据的获取方法、装置及终端
本专利技术涉及互联网
,特别是涉及一种查询数据的获取方法、装置及终端。
技术介绍
伴随着互联网技术以及社会经济的飞快发展,互联网越来越影响人们的日常工作、学习及生活。例如,为了方便人们的生活,在外卖平台中除了提供传统的餐饮业务外,还提供超市、生鲜、药品等各项服务。在外卖平台的客户端中,当用户以文字或者语音转化为文字的形式,输入查询关键字查询目标商品时,服务器会根据查询关键字查询与之匹配的目标商品,以供用户获取。目前,常见的查询方法是采用基于字典的方式,而常见的有两种字典:查询字典和查询片段字典。两种字典的查询格式一致,均包含多个条目,每个条目由一个字符串和对应的查询类别组成。但是,两种字典的优先级不同,查询字典的优先级高于查询片段字典,即当用户输入一个查询关键字时,优先匹配查询字典里的所有词条,若查询关键字完全匹配查询字典中的任意一个字符串,则以字符串对应的查询类别作为结果返回;如果匹配失败,继续匹配查询片段字典,若查询的一个子片段完全匹配了查询片段字典中的任意一个字符串,则以字符串对应的意图类别作为结果返回;若查询片段字典匹配失败,则返回空值。专利技术人在实现上述专利技术过程中,发现现有技术中基于查询字典和查询片段字典中的任一种字典进行目标商品查询时,一个查询关键字可能会匹配字典中的多个条目,因此会发生多个查询类别之间的冲突,从而导致返回的查询结果出现错误;此外,该种基于字典查询的方式严重依赖于字典,而查询字典和查询片段字典均需要大量的人工去整理,成本较高,且出错率也较高。
技术实现思路
有鉴于此,本专利技术提供的一种查询数据的获取方法、装置及终端,主要目的在于提高获取查询数据的准确性,同时减少不必要的人工资源开销。第一方面,本专利技术提供了一种查询数据的获取方法,包括:根据查询关键词提取获取目标查询结果的查询特征;将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵,其中,所述预设查询分类模型用于根据训练样例训练得到每个查询特征对应的最大熵,最大熵的查询特征对应一个查询类别;基于所述最大熵的查询特征与查询类别之间的对应关系,确定所述查询特征的最大熵所对应的查询类别;返回与所述查询关键词属于同一所述查询类别的、且相关的所述目标查询结果。可选的,在将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵之前,所述方法还包括:定义所述预设查询分类模型的查询特征为一元词和/或多元词;构建所述预设查询分类模型。可选的,所述构建所述预设查询分类模型包括:获取训练样例,所述训练样例为根据历史查询关键词及点击查询数据确定,所述点击查询数据中包含有商户类别;根据所述训练样例与对应的点击查询数据的点击次数,确定点击每个商户类别的权重;根据点击每个商户类别的权重最大值,确定所述训练样例与所述商户类别之间的对应关系,完成所述预设查询分类模型的构建。可选的,获取训练样例包括:从历史日志数据中获取预设时间段内的历史查询关键词及对应的点击查询数据;根据所述点击查询数据确定商户标识ID,并根据所述商户标识ID确定商户类别;将所述历史查询关键词、所述商户标识ID及所述商户类别作之间的映射关系进行存储,记作一行;根据定义的一元词和/或多元词提取所述历史查询关键词的历史查询特征,每个历史查询特征作为一个训练样例。可选的,根据查询关键词提取获取目标查询结果的查询特征包括:将所述查询关键词进行分词,每个分词可作为一个所述查询特征;根据所述分词及所述预设查询分类模型的定义,提取所述查询关键词的一元词查询特征和/或多元词查询特征。可选的,将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵包括:将所述查询特征与所述预设查询分类模型中的历史查询特征进行匹配;若匹配成功,则获取匹配历史查询特征所对应的最大权重;根据所述最大权重及预设特征函数计算所述查询特征的最大熵,所述最大权重与最大熵成正比。可选的,所述方法应用于外卖平台中,所述外卖平台中包含多种类别的查询数据。第二方面,本专利技术提供一种查询数据的获取装置,包括:提取单元,用于根据查询关键词提取获取目标查询结果的查询特征;处理单元,用于将所述获取单元获取的所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵,其中,所述预设查询分类模型用于根据训练样例训练得到每个查询特征对应的最大熵,最大熵的查询特征对应一个查询类别;确定单元,用于基于所述处理单元得到的所述最大熵的查询特征与查询类别之间的对应关系,确定所述查询特征的最大熵所对应的查询类别;返回单元,用于返回与所述查询关键词属于同一所述查询类别的、且相关的所述目标查询结果。可选的,所述装置还包括:定义单元,用于在所述处理单元将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵之前,定义所述预设查询分类模型的查询特征为一元词和/或多元词;构建单元,用于构建所述预设查询分类模型。可选的,所述构建单元包括:获取模块,用于获取训练样例,所述训练样例为根据历史查询关键词及点击查询数据确定,所述点击查询数据中包含有商户类别;第一确定模块,用于根据所述获取模块获取的所述训练样例与对应的点击查询数据的点击次数,确定点击每个商户类别的权重;第二确定模块,用于根据所述第一确定模块确定的点击每个商户类别的权重最大值,确定所述训练样例与所述商户类别之间的对应关系,完成所述预设查询分类模型的构建。可选的,所述获取模块包括:获取子模块,用于从历史日志数据中获取预设时间段内的历史查询关键词及对应的点击查询数据;确定子模块,用于根据所述获取子模块获取的所述点击查询数据确定商户标识ID,并根据所述商户标识ID确定商户类别;存储子模块,用于将所述确定子模块确定的所述历史查询关键词、所述商户标识ID及所述商户类别作之间的映射关系进行存储,记作一行;提取子模块,用于根据定义的一元词和/或多元词提取所述历史查询关键词的历史查询特征,每个历史查询特征作为一个训练样例。可选的,所述提取单元包括:分词模块,用于将所述查询关键词进行分词,每个分词可作为一个所述查询特征;提取模块,用于根据所述分词模块得到的所述分词及所述预设查询分类模型的定义,提取所述查询关键词的一元词查询特征和/或多元词查询特征。可选的,所述处理单元包括:匹配模块,用于将所述查询特征与所述预设查询分类模型中的历史查询特征进行匹配;获取模块,用于当所述匹配模块匹配成功时,获取匹配历史查询特征所对应的最大权重;计算模块,用于根据所述最大权重及预设特征函数计算所述查询特征的最大熵,所述最大权重与最大熵成正比。可选的,所述装置应用于外卖平台中,所述外卖平台中包含多种类别的查询数据。第三方面,本专利技术还提供一种查询数据的获取终端,所述终端包括处理器和存储器,其中,所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令被所述处理器执行以实现第一方面中任一项所述的查询数据的获取方法的步骤。第四方面,本专利技术还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现第一方面中任一项所述的查询数据的获取方法的步骤。借由上述技术方案,本专利技术提供的查询数据的获取方法、装置及终端,根据查询关键词提取获取目标查询结果的查询特征本文档来自技高网...
查询数据的获取方法、装置及终端

【技术保护点】
一种查询数据的获取方法,其特征在于,包括:根据查询关键词提取获取目标查询结果的查询特征;将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵,其中,所述预设查询分类模型用于根据训练样例训练得到每个查询特征对应的最大熵,最大熵的查询特征对应一个查询类别;基于所述最大熵的查询特征与查询类别之间的对应关系,确定所述查询特征的最大熵所对应的查询类别;返回与所述查询关键词属于同一所述查询类别的、且相关的所述目标查询结果。

【技术特征摘要】
1.一种查询数据的获取方法,其特征在于,包括:根据查询关键词提取获取目标查询结果的查询特征;将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵,其中,所述预设查询分类模型用于根据训练样例训练得到每个查询特征对应的最大熵,最大熵的查询特征对应一个查询类别;基于所述最大熵的查询特征与查询类别之间的对应关系,确定所述查询特征的最大熵所对应的查询类别;返回与所述查询关键词属于同一所述查询类别的、且相关的所述目标查询结果。2.根据权利要求1所述的方法,其特征在于,在将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵之前,所述方法还包括:定义所述预设查询分类模型的查询特征为一元词和/或多元词;构建所述预设查询分类模型。3.根据权利要求2所述的方法,其特征在于,所述构建所述预设查询分类模型包括:获取训练样例,所述训练样例为根据历史查询关键词及点击查询数据确定,所述点击查询数据中包含有商户类别;根据所述训练样例与对应的点击查询数据的点击次数,确定点击每个商户类别的权重;根据点击每个商户类别的权重最大值,确定所述训练样例与所述商户类别之间的对应关系,完成所述预设查询分类模型的构建。4.根据权利要求3所述的方法,其特征在于,获取训练样例包括:从历史日志数据中获取预设时间段内的历史查询关键词及对应的点击查询数据;根据所述点击查询数据确定商户标识ID,并根据所述商户标识ID确定商户类别;将所述历史查询关键词、所述商户标识ID及所述商户类别作之间的映射关系进行存储,记作一行;根据定义的一元词和/或多元词提取所述历史查询关键词的历史查询特征,每个历史查询特征作为一个训练样例。5.根据权利要求2所述的方法,其特征在于,根据查询关键词提取获取目标查询结果的查询...

【专利技术属性】
技术研发人员:李泽中
申请(专利权)人:北京小度信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1