查询处理方法、装置、服务器及存储介质制造方法及图纸

技术编号：20329224 阅读：19 留言：0更新日期：2019-02-13 05:48

本发明专利技术实施例公开了一种查询处理方法、装置、服务器及存储介质，其中，所述方法包括：依据查询序列中包括的各词语和各实体分别确定查询序列的词向量表示和实体向量表示；依据段落中包括的各词语和各实体分别确定段落的词向量表示和实体向量表示；依据查询序列的词向量表示和实体向量表示，以及段落的词向量表示和实体向量表示，确定查询序列与段落之间的相似度。本发明专利技术实施例通过在确定查询序列与段落之间相似度过程中引入了基于知识图谱确定的查询序列中实体向量表示，以及段落中实体向量表示，进而引入了客观世界的知识，具有更好的泛化能力和通用性。

全部详细技术资料下载

【技术实现步骤摘要】
查询处理方法、装置、服务器及存储介质
本专利技术实施例涉及互联网
，尤其涉及一种查询处理方法、装置、服务器及存储介质。
技术介绍
随着互联网技术的发展，用户越来越倾向于通过搜索引擎或各种问答系统获取所需要的相关信息。而搜索引擎、问答系统的核心技术是排序，通过将排序靠前的相关信息优先展示给用户，以满足用户检索需求。传统的排序是基于字面、后来引入了同义词、点击共现等技术，但是这些方法并没有真正理解语义，也没有很好的泛化能力。目前，随着机器学习、深度学习的发展，一些基于特征或表示的模型取得了不错的成绩，如LTR(LearningtoRank，线性模型)、DSSM(DeepStructuredSemanticModels，深度结构化语言模型)。但诸如此类的模型本质上还是基于统计，需要庞大的训练数据，计算机并没有真正理解语义，并且通过此类模型进行检索排序的泛化能力和通用性有限。
技术实现思路
本专利技术实施例提供了一种查询处理方法、装置、服务器及存储介质，通过在确定查询序列与段落之间相似度时引入基于知识图谱确定的查询序列中实体向量表示，以及段落中实体向量表示，以达到提升查询处理技术的泛化能力和通用性的目的。第一方面，本专利技术实施例提供了一种查询处理方法，包括：依据查询序列中包括的各词语和各实体分别确定查询序列的词向量表示和实体向量表示；依据段落中包括的各词语和各实体分别确定段落的词向量表示和实体向量表示；依据查询序列的词向量表示和实体向量表示，以及段落的词向量表示和实体向量表示，确定查询序列与段落之间的相似度。可选的，确定查询序列与段落之间的相似度之后，还包括：...

【技术保护点】
1.一种查询处理方法，其特征在于，包括：依据查询序列中包括的各词语和各实体分别确定查询序列的词向量表示和实体向量表示；依据段落中包括的各词语和各实体分别确定段落的词向量表示和实体向量表示；依据查询序列的词向量表示和实体向量表示，以及段落的词向量表示和实体向量表示，确定查询序列与段落之间的相似度。

【技术特征摘要】
1.一种查询处理方法，其特征在于，包括：依据查询序列中包括的各词语和各实体分别确定查询序列的词向量表示和实体向量表示；依据段落中包括的各词语和各实体分别确定段落的词向量表示和实体向量表示；依据查询序列的词向量表示和实体向量表示，以及段落的词向量表示和实体向量表示，确定查询序列与段落之间的相似度。2.根据权利要求1所述的方法，其特征在于，依据查询序列的词向量表示和实体向量表示，以及段落的词向量表示和实体向量表示，确定查询序列与段落之间的相似度，包括：依据查询序列的词向量表示和段落的词向量表示确定查询序列与段落之间的第一相似度；依据查询序列的实体向量表示和段落的实体向量表示确定查询序列与段落之间的第二相似度；依据查询序列与段落之间的第一相似度和第二相似度，确定查询序列与段落之间的相似度。3.根据权利要求2所述的方法，其特征在于，依据查询序列与段落之间的第一相似度和第二相似度，确定查询序列与段落之间的相似度，包括：依据查询序列的词向量表示和段落的实体向量表示确定查询序列与段落之间的第三相似度；依据查询序列的实体向量表示和段落的词向量表示确定查询序列与段落之间的第四相似度；依据查询序列与段落的第一相似度，第二相似度，第三相似度以及第四相似度，确定查询序列与段落之间的相似度。4.根据权利要求3所述的方法，其特征在于，依据查询序列与段落的第一相似度，第二相似度，第三相似度以及第四相似度，确定查询序列与段落之间的相似度，包括：对所述查询序列与段落的第一相似度，第二相似度，第三相似度以及第四相似度进行加权处理，并依据加权结果确定查询序列与段落之间的相似度。5.根据权利要求1所述的方法，其特征在于，依据查询序列的词向量表示和实体向量表示，以及段落的词向量表示和实体向量表示，分别确定查询序列与段落之间的相似度之前，还包括：基于知识图谱确定查询序列中包括的各实体，且基于知识图谱确定段落中包括的各实体。6.根据权利要求1-5中任一所述的方法，其特征在于，确定查询序列与段落之间的相似度之后，还包括：依据查询序列与各段落之间的相似度，对各段落进行排序。7.一种查询处理装置，其特征在...

【专利技术属性】
技术研发人员：冯欣伟，宋勋超，余淼，周环宇，康绍舜，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人