对搜索条目进行排序的方法及系统技术方案

技术编号：11415196 阅读：74 留言：0更新日期：2015-05-06 15:04

本发明专利技术提供一种对搜索条目进行排序的方法及系统，所述方法包括：通过神经网络将查询文本按照语序表示成向量；根据所述表示出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数；根据所述计算出的排序分数对所述搜索条目进行排序。通过采用本发明专利技术可以兼顾一词多义与近义词的匹配以及词的语序来进行搜索排序，能够给出更为准确的排序结果。

全部详细技术资料下载

【技术实现步骤摘要】
对搜索条目进行排序的方法及系统
本专利技术涉及通信领域，更为具体而言，涉及对搜索条目进行排序的方法及系统。
技术介绍
针对用户所输入的查询文本，给用户返回排序的搜索结果是搜索引擎系统的基础。其中计算用户输入的查询文本与待排序的搜索条目之间的排序分数是搜索引擎系统的核心问题。传统的计算查询文本与搜索条目之间的排序分数的方法是通过计算查询文本与搜索条目这两个字符串中所包含的词完全匹配上的程度，即这两个文本串的相似度，来计算查询文本与搜索条目之间的排序分数。但是这种基于词的字面上的匹配程度来计算排序分数的方法，并没有能考察到词的一词多义以及近似词的匹配，也没有考察到词的顺序问题。近年来，随着深度学习技术的发展，出现了利用DNN(DeepNeuralNetwork，深度神经网络)技术来学习词的向量表示(把词表示为一个实数组成的向量)，通过计算由词向量组成的查询文本与搜索条目之间的相似度来计算查询文本与搜索条目之间的排序分数的方法。这种方法一般通过一个FeedForwardNeuralNetwork(前馈神经网络)来把查询文本与搜索条目中的词都映射到一个低维的向量空间当中；简单的把查询文本中的所有词的词向量相加得到查询文本的向量表示，把搜索条目中的所有的词的词向量也相加得到搜索条目的向量表示，通过计算这两个向量表示之间的相似度来作为查询文本与搜索条目之间的排序分数。这种方法虽然从一定程度上解决了传统方法当中的一词多义与近义词的问题，但是，因为忽略了词在查询文本与搜索条目当中的位置信息，因此不能解决查询文本与搜索条目中的词的顺序不同所带来的差异，例如：查询文本1：“我...
对搜索条目进行排序的方法及系统

【技术保护点】
一种对搜索条目进行排序的方法，其特征在于，所述方法包括：通过神经网络将查询文本按照语序表示成向量；根据所述表示出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数；根据所述计算出的排序分数对所述搜索条目进行排序。

【技术特征摘要】
1.一种对搜索条目进行排序的方法，其特征在于，所述方法包括：通过神经网络将查询文本按照语序表示成向量；根据所述表示出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数；根据所述计算出的排序分数对所述搜索条目进行排序。2.如权利要求1所述的方法，其特征在于，所述方法还包括：在执行通过神经网络将查询文本按照语序表示成向量的步骤前，训练出所述神经网络的模型参数。3.如权利要求2所述的方法，其特征在于，训练出所述神经网络的模型参数包括：获取训练数据；根据所述获取的训练数据通过损失函数训练出所述模型参数。4.如权利要求3所述的方法，其特征在于，所述训练数据包括：查询文本以及所述查询文本所对应的搜索条目。5.如权利要求3或4所述的方法，其特征在于，所述损失函数包括：对数损失函数。6.如权利要求5所述的方法，其特征在于，训练出所述神经网络的模型参数还包括：通过随机梯度下降法以及反向传播算法对所述模型参数进行优化。7.如权利要求1所述的方法，其特征在于，通过神经网络将查询文本按照语序表示成向量包括：按照语序将所述查询文本的词序列中的各词输入到所述神经网络的编码网络；根据所述语序将所述输入的各词循环映射到一个向量空间；将所述循环映射结束时所得到的向量转化为所述查询文本的向量表示。8.如权利要求1所述的方法，其特征在于，根据所述表示出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数包括：根据所述表示出的向量通过所述神经网络的解码网络计算在给定所述查询文本的条件下生成所述搜索条目的概率，并将所述计算出的概率作为所述查询文本与所述搜索条目之间的排序分数。9.一种对搜索条目进行排...

【专利技术属性】
技术研发人员：张军，徐晓明，吴先超，和为，刘占一，于佃海，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人