基于神经网络的搜索结果的召回方法和装置制造方法及图纸

技术编号：14903809 阅读：126 留言：0更新日期：2017-03-29 19:02

本发明专利技术提出一种基于神经网络的搜索结果的召回方法和装置，该方法包括接收搜索信息，并采集与搜索信息对应的多个搜索结果；获取与搜索信息对应的特征向量并作为第一特征向量，并获取与多个搜索结果中每个搜索结果的标题对应的特征向量并作为第二特征向量；获取第一特征向量与每个第二特征向量之间的相似度，并根据相似度获取搜索信息与每个搜索结果之间的语义匹配评分值；根据语义匹配评分值，从多个搜索结果中确定目标搜索结果，并将目标搜索结果作为搜索信息召回的搜索结果。通过本发明专利技术能够加强搜索结果和搜索信息的语义匹配程度，提高召回的搜索结果和用户输入的搜索信息的相关度，满足用户的搜索需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网
，尤其涉及一种基于神经网络的搜索结果的召回方法和装置。
技术介绍
随着互联网技术的快速发展，搜索引擎的功能也日趋强大。目前搜索引擎可以根据用户输入的搜索信息，召回全部或者部分命中搜索信息的搜索结果，且搜索结果为多个。相关技术中，在召回搜索结果后，通过将搜索信息在搜索结果中的命中的位置(例如，标题、内容、标签等)、命中词数的比例，以及搜索结果的内容质量、搜索结果的权威性等特征数值化，之后再将命中的特征数值进行线性加和处理，从而为召回多个搜索结果中的每个搜索结果与搜索信息的匹配关系赋一个评分值，并以此评分值对多个搜索结果进行排序。这种方式下，由于搜索信息召回的搜索结果严重依赖于搜索信息的命中情况，而一些命中情况差，但实际语义符合用户搜索意图的搜索结果被现有的打分方法过滤，搜索结果和用户输入的搜索信息在语义上匹配程度较低。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的一个目的在于提出一种基于神经网络的搜索结果的召回方法，能够加强搜索结果和搜索信息的语义匹配程度，提高召回的搜索结果和用户输入的搜索信息的相关度，满足用户的搜索需求。本专利技术的另一个目的在于提出一种基于神经网络的搜索结果的召回装置。本专利技术的又一个目的在于提出一种基于神经网络的搜索结果的召回装置。本专利技术的另一个目的在于提出一种非临时性计算机可读存储介质。本专利技术的另一个目的在于提出一种计算机程序产品。为达到上述目的，本专利技术第一方面实施例提出的基于神经网络的搜索结果的召回方法，包括：接收搜索信息，并采集与所述搜索信息...

【技术保护点】
一种基于神经网络的搜索结果的召回方法，其特征在于，包括以下步骤：接收搜索信息，并采集与所述搜索信息对应的多个搜索结果；获取与所述搜索信息对应的特征向量并作为第一特征向量，并获取与所述多个搜索结果中每个搜索结果的标题对应的特征向量并作为第二特征向量；获取所述第一特征向量与每个第二特征向量之间的相似度，并根据所述相似度获取所述搜索信息与所述每个搜索结果之间的语义匹配评分值；根据所述语义匹配评分值，从所述多个搜索结果中确定目标搜索结果，并将所述目标搜索结果作为所述搜索信息召回的搜索结果。

【技术特征摘要】
1.一种基于神经网络的搜索结果的召回方法，其特征在于，包括以下步骤：接收搜索信息，并采集与所述搜索信息对应的多个搜索结果；获取与所述搜索信息对应的特征向量并作为第一特征向量，并获取与所述多个搜索结果中每个搜索结果的标题对应的特征向量并作为第二特征向量；获取所述第一特征向量与每个第二特征向量之间的相似度，并根据所述相似度获取所述搜索信息与所述每个搜索结果之间的语义匹配评分值；根据所述语义匹配评分值，从所述多个搜索结果中确定目标搜索结果，并将所述目标搜索结果作为所述搜索信息召回的搜索结果。2.如权利要求1所述的基于神经网络的搜索结果的召回方法，其特征在于，所述获取与所述搜索信息对应的特征向量并作为第一特征向量，并获取与所述多个搜索结果中每个搜索结果的标题对应的特征向量并作为第二特征向量，包括：分别对所述搜索信息和所述每个搜索结果的标题进行分词处理，以获取与所述搜索信息对应的多个分词并作为第一分词，以及与每个标题对应的多个分词并作为第二分词；根据预设特征模型确定每个所述第一分词的第一特征子向量，并根据所述预设特征模型确定每个所述第二分词的第二特征子向量；对多个所述第一特征子向量进行向量加和处理，并将加和处理后的特征子向量作为与所述搜索信息对应的第一中间特征向量；对所述每个标题的多个所述第二特征子向量进行加和处理，并将与所述每个标题对应的加和处理后的特征子向量作为与所述每个标题对应的第二中间特征向量；根据所述第一中间特征向量和所述第二中间特征向量获取所述预设算法输出的与所述搜索信息对应的第一特征向量，以及与所述多个搜索结果中每个搜索结果的标题对应的第二特征向量。3.如权利要求1所述的基于神经网络的搜索结果的召回方法，其特征在于，所述根据所述第一中间特征向量和所述第二中间特征向量获取所述预设算法输出的与所述搜索信息对应的第一特征向量，以及与所述多个搜索结果中每个搜索结果的标题对应的第二特征向量，包括：采用所述预设算法对所述第一中间特征向量中的每个元素作非线性变换处理，并根据多个处理后的元素生成非线性变换后的第一中间特征向量；采用所述预设算法中的全连通矩阵与所述非线性变换后的第一中间特征向量作乘积，并将乘积得到的特征向量作为所述第一特征向量；采用所述预设算法对所述第二中间特征向量中的每个元素作非线性变换处理，并根据多个处理后的元素生成非线性变换后的第二中间特征向量；采用所述预设算法中的全连通矩阵与所述非线性变换后的第二中间特征向量作乘积，并将乘积得到的特征向量作为所述第二特征向量。4.如权利要求2所述的基于神经网络的搜索结果的召回方法，其特征在于，还包括：在所述接收搜索信息之前，通过以下步骤建立所述预设特征模型：采集多个样本搜索信息，并采集所述多个样本搜索信息对应的多个样本搜索结果的标题；分别对所述样本搜索信息和所述每个样本搜索结果的标题进行分词处理，以获取与所述样本搜索信息对应的多个分词作为第三分词，以及与每个标题对应的多个分词作为第四分词；确定每个第三分词的第三特征子向量，并将用户所点击的第四分词的特征向量作为第四特征子向量，以及将用户未点击的第四分词的特征向量作为第五特征子向量；对多个第三特征子向量进行向量加和处理，得到加和处理后的特征子向量作为与所述样本搜索信息对应的第三中间特征向量；对所述每个标题的多个第四特征子向量进行加和处理，得到加和处理后的特征子向量作为与所述用户所点击的第四分词对应的第四中间特征向量；对所述每个标题的多个第五特征子向量进行加和处理，得到加和处理后的特征子向量作为与所述用户未点击的第四分词对应的第五中间特征向量；根据所述第三中间特征向量、所述第四中间特征向量，以及所述第五中间特征向量获取所述预设算法输出的与所述样本搜索信息对应的第三特征向量、与所述用户所点击的第四分词对应的第四特征向量，以及与所述用户未点击的第四分词对应的第五特征向量；将所述第三特征向量与所述第四特征向量之间的相似度作为第一相似度，并将所述第三特征向量与所述第五特征向量之间的相似度作为第二相似度；将所述第一相似度与所述第二相似度作差，得到差值，并通过调整所述第三特征向量、所述第四特征向量，以及所述第五特征向量中元素的权重以对所述差值进行调节；确定使所述差值取得目标数值的权重对应的第三特征向量、第四特征向量，以及第五特征向量，以建立所述预设特征模型。5.如权利要求1所述的基于神经网络的搜索结果的召回方法，其特征在于，所述获取所述第一特征向量与每个第二特征向量之间的相似度，并根据所述相似度获取所述搜索信息与所述每个搜索结果之间的语义匹配评分值，包括：计算所述第一特征向量与所述每个第二特征向量之间的相似度；将所述相似度作为所述搜索信息与所述每个搜索结果的语义匹配评分值。6.如权利要求1所述的基于神经网络的搜索结果的召回方法，其特征在于，所述根据所述语义匹配评分值，从所述多个搜索结果中确定目标搜索结果，包括：将所述语义匹配评分值作为排序模型的输入，获取所述排序模型输出的与所述每个搜索结果对应的评分值；根据所述对应的评分值对所述多个搜索结果进行排序，并根据排序结果选定预设个数的搜索结果作为所述目标搜索结果。7.如权利要求1或4或5所述的基于神经网络的搜索结果的召回方法，其特征在于，所述相似度为余弦...

【专利技术属性】
技术研发人员：姜迪，石磊，陈泽裕，蒋佳军，连荣忠，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人