The invention discloses a method, device and terminal for obtaining query data, which involves the field of Internet technology. The main purpose of the invention is to improve the accuracy of obtaining the query data and reduce the unnecessary cost of artificial resources. The main technical scheme of the invention includes: extracting the query characteristics of the result of the target query according to the query key words; inputting the query feature into the preset query classification model and obtaining the maximum entropy of the query feature, in which the presupposed query classification model is used to get each lookup according to the training sample. Query feature corresponding to the maximum entropy, the query feature of the maximum entropy corresponds to a query class; based on the corresponding relationship between the query feature of the maximum entropy and the query category, the query category corresponding to the maximum entropy of the query feature is determined; and the query keyword is returned to the same query category and is related to the query keyword. The result of the target query. The invention is mainly applied to the process of acquiring query data in the takeaway platform.
【技术实现步骤摘要】
查询数据的获取方法、装置及终端
本专利技术涉及互联网
,特别是涉及一种查询数据的获取方法、装置及终端。
技术介绍
伴随着互联网技术以及社会经济的飞快发展,互联网越来越影响人们的日常工作、学习及生活。例如,为了方便人们的生活,在外卖平台中除了提供传统的餐饮业务外,还提供超市、生鲜、药品等各项服务。在外卖平台的客户端中,当用户以文字或者语音转化为文字的形式,输入查询关键字查询目标商品时,服务器会根据查询关键字查询与之匹配的目标商品,以供用户获取。目前,常见的查询方法是采用基于字典的方式,而常见的有两种字典:查询字典和查询片段字典。两种字典的查询格式一致,均包含多个条目,每个条目由一个字符串和对应的查询类别组成。但是,两种字典的优先级不同,查询字典的优先级高于查询片段字典,即当用户输入一个查询关键字时,优先匹配查询字典里的所有词条,若查询关键字完全匹配查询字典中的任意一个字符串,则以字符串对应的查询类别作为结果返回;如果匹配失败,继续匹配查询片段字典,若查询的一个子片段完全匹配了查询片段字典中的任意一个字符串,则以字符串对应的意图类别作为结果返回;若查询片段字典匹配失败,则返回空值。专利技术人在实现上述专利技术过程中,发现现有技术中基于查询字典和查询片段字典中的任一种字典进行目标商品查询时,一个查询关键字可能会匹配字典中的多个条目,因此会发生多个查询类别之间的冲突,从而导致返回的查询结果出现错误;此外,该种基于字典查询的方式严重依赖于字典,而查询字典和查询片段字典均需要大量的人工去整理,成本较高,且出错率也较高。
技术实现思路
有鉴于此,本专利技术提供的一种查 ...
【技术保护点】
一种查询数据的获取方法,其特征在于,包括:根据查询关键词提取获取目标查询结果的查询特征;将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵,其中,所述预设查询分类模型用于根据训练样例训练得到每个查询特征对应的最大熵,最大熵的查询特征对应一个查询类别;基于所述最大熵的查询特征与查询类别之间的对应关系,确定所述查询特征的最大熵所对应的查询类别;返回与所述查询关键词属于同一所述查询类别的、且相关的所述目标查询结果。
【技术特征摘要】
1.一种查询数据的获取方法,其特征在于,包括:根据查询关键词提取获取目标查询结果的查询特征;将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵,其中,所述预设查询分类模型用于根据训练样例训练得到每个查询特征对应的最大熵,最大熵的查询特征对应一个查询类别;基于所述最大熵的查询特征与查询类别之间的对应关系,确定所述查询特征的最大熵所对应的查询类别;返回与所述查询关键词属于同一所述查询类别的、且相关的所述目标查询结果。2.根据权利要求1所述的方法,其特征在于,在将所述查询特征输入预设查询分类模型进行计算,得到所述查询特征的最大熵之前,所述方法还包括:定义所述预设查询分类模型的查询特征为一元词和/或多元词;构建所述预设查询分类模型。3.根据权利要求2所述的方法,其特征在于,所述构建所述预设查询分类模型包括:获取训练样例,所述训练样例为根据历史查询关键词及点击查询数据确定,所述点击查询数据中包含有商户类别;根据所述训练样例与对应的点击查询数据的点击次数,确定点击每个商户类别的权重;根据点击每个商户类别的权重最大值,确定所述训练样例与所述商户类别之间的对应关系,完成所述预设查询分类模型的构建。4.根据权利要求3所述的方法,其特征在于,获取训练样例包括:从历史日志数据中获取预设时间段内的历史查询关键词及对应的点击查询数据;根据所述点击查询数据确定商户标识ID,并根据所述商户标识ID确定商户类别;将所述历史查询关键词、所述商户标识ID及所述商户类别作之间的映射关系进行存储,记作一行;根据定义的一元词和/或多元词提取所述历史查询关键词的历史查询特征,每个历史查询特征作为一个训练样例。5.根据权利要求2所述的方法,其特征在于,根据查询关键词提取获取目标查询结果的查询...
【专利技术属性】
技术研发人员:李泽中,
申请(专利权)人:北京小度信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。