信息检索方法及装置制造方法及图纸

技术编号:19480309 阅读:21 留言:0更新日期:2018-11-17 10:34
本发明专利技术涉及了一种信息检索方法及装置,所述信息检索方法,包括:获取检索关键词,并根据所述检索关键词提取得到用户的用户特征向量,所述检索关键词指示了所述用户请求检索的信息;按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;通过包含所述检索关键词的目标搜索子图从信息库中得到所述用户请求检索的信息。采用本发明专利技术所提供的信息检索方法及装置能够有效提高信息检索效率。

【技术实现步骤摘要】
信息检索方法及装置
本专利技术涉及信息检索领域,尤其涉及一种信息检索方法及装置。
技术介绍
随着计算机技术的发展,知识图谱作为语义知识查询的基础被越来越广泛地应用到了信息检索领域,即信息库中存储数以百万计的信息,并为此构建相关联的知识图谱,以供用户根据输入的检索信息对知识图谱进行全图查询,进而从知识图谱相关联的信息库中得到相关信息。例如,电视用户可以通过输入自己喜爱的演员名字而在信息库中检索到与演员相关的电视节目。然而,面临海量用户频繁地请求对知识图谱进行全图查询,将造成知识图谱的查询速度出现瓶颈,进而影响信息检索效率。
技术实现思路
为了解决上述技术问题,本专利技术的一个目的在于提供一种信息检索方法及装置。其中,本专利技术所采用的技术方案为:一方面,一种信息检索方法,包括:获取检索关键词,并根据所述检索关键词提取得到所述用户的用户特征向量,所述检索关键词指示了用户请求检索的信息;按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;通过包含所述检索关键词的目标搜索子图从信息库中得到所述用户请求检索的信息。在一示例性实施例中,所述按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群,包括:将所述用户的用户特征向量分别输入至用户分类模型的若干单高斯模型,计算得到所述用户针对不同单高斯模型的若干先验概率值,所述单高斯模型与用户群一一对应;根据若干所述先验概率值判断所述用户的用户特征向量是否符合所述用户分类模型;如果所述用户的用户特征向量符合所述用户分类模型,则计算所述用户针对不同单高斯模型的若干后验概率值;将计算得到后验概率值最大的单高斯模型所对应的用户群作为所述用户所属的候选用户群。在一示例性实施例中,所述按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群,还包括:设置若干用户群,并根据若干所述用户群创建包含若干单高斯模型的混合高斯模型,所述单高斯模型与所述用户群一一对应;获取样本信息,并根据所述样本信息进行用户特征向量提取;根据提取得到的用户特征向量对引入加速因子的所述混合高斯模型进行模型训练;当所述混合高斯模型的参数在所述加速因子作用下使得最大似然函数的期望达到最大时,将所述混合高斯模型作为所述用户分类模型,所述最大似然函数是根据提取得到的用户特征向量计算的。在一示例性实施例中,所述获取为所述候选用户群建立的搜索子图集合,包括:对所述候选用户群对应的知识图谱中节点进行遍历,以遍历到的节点作为初始节点;将所述初始节点添加至已选节点集合,并将所述知识图谱中所述初始节点的相邻节点添加至候选节点集合;根据所述已选节点集合和所述候选节点集合对所述知识图谱进行搜索子图划分;待所述知识图谱中的节点完成遍历,得到为所述候选用户群建立的所述搜索子图集合,所述搜索子图集合包含至少一搜索子图。在一示例性实施例中,所述根据所述已选节点集合和所述候选节点集合对所述知识图谱进行搜索子图划分,包括:如果所述候选节点集合非空,则对非空的所述候选节点集合中候选节点进行遍历,计算遍历到的候选节点与所述已选节点集合中已选节点之间的平均距离;如果所述平均距离小于距离阈值,则将遍历到的候选节点添加至所述已选节点集合,并将所述知识图谱中遍历到候选节点的相邻节点添加至所述候选节点集合;直至所述候选节点集合为空,从所述知识图谱中划分得到所包含节点属于所述已选节点集合的搜索子图。在一示例性实施例中,所述获取为所述候选用户群建立的搜索子图集合,还包括:由所述候选用户群中用户所输入的检索关键词生成所述候选用户群的关键词集合;将所述关键词集合中的关键词添加至节点,并按照关键词的语义关系在两节点之间构建路径,得到所述候选用户群对应的知识图谱。在一示例性实施例中,所述按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图,包括:进行所述检索关键词与若干所述搜索子图所包含节点中关键词之间的匹配,根据匹配结果确定包含所述检索关键词的极大搜索子图;如果所述极大搜索子图为单个,则以所述极大搜索子图作为所述目标搜索子图;如果所述极大搜索子图为多个,则根据多个所述极大搜索子图所确定的待合并组进行所述目标搜索子图的合并。在一示例性实施例中,所述根据多个所述极大搜索子图所确定的待合并组进行所述目标搜索子图的合并,包括:如果多个所述极大搜索子图所确定的待合并组存在多个,则针对每个所述待合并组中的所述极大搜索子图进行遍历;确定遍历到的所述极大搜索子图与所述待合并组中其余所述极大搜索子图之间的连通路径;计算遍历到的所述极大搜索子图中节点经由所确定连通路径,到达其余所述极大搜索子图中节点的平均距离;将平均距离最小的所述待合并组中所述极大搜索子图合并为所述目标搜索子图。另一方面,一种信息检索装置,包括:检索信息获取模块,用于获取检索关键词,并根据所述检索关键词提取得到所述用户的用户特征向量,所述检索关键词指示了用户请求检索的信息;用户分类模块,用于按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;子图查询模块,用于获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;信息检索模块,用于通过包含所述检索关键词的目标搜索子图从信息库中得到所述用户请求检索的信息。在一示例性实施例中,所述用户分类模块包括:第一概率值计算单元,用于将所述用户的用户特征向量分别输入至用户分类模型的若干单高斯模型,计算得到所述用户针对不同单高斯模型的若干先验概率值,所述单高斯模型与用户群一一对应;判断单元,用于根据若干所述先验概率值判断所述用户的用户特征向量是否符合所述用户分类模型;第二概率值计算单元,用于如果所述用户的用户特征向量符合所述用户分类模型,则计算所述用户针对不同单高斯模型的若干后验概率值;用户群定义单元,用于将计算得到后验概率值最大的单高斯模型所对应的用户群作为所述用户所属的候选用户群。在一示例性实施例中,所述用户分类模块还包括:模型创建单元,用于设置若干用户群,并根据若干所述用户群创建包含若干单高斯模型的混合高斯模型,所述单高斯模型与所述用户群一一对应;特征提取单元,用于获取样本信息,并根据所述样本信息进行用户特征向量提取;模型训练单元,用于根据提取得到的用户特征向量对引入加速因子的所述混合高斯模型进行模型训练;模型定义单元,用于当所述混合高斯模型的参数在所述加速因子作用下使得最大似然函数的期望达到最大时,将所述混合高斯模型作为所述用户分类模型,所述最大似然函数是根据提取得到的用户特征向量计算的。在一示例性实施例中,所述子图查询模块包括:节点遍历单元,用于对所述候选用户群对应的知识图谱中节点进行遍历,以遍历到的节点作为初始节点;节点添加单元,用于将所述初始节点添加至已选节点集合,并将所述知识图谱中所述初始节点的相邻节点添加至候选节点集合;图谱划分单元,用于根据所述已选节点集合和所述候选节点集合对所述知识图谱进行搜索子图划分本文档来自技高网...

【技术保护点】
1.一种信息检索方法,其特征在于,包括:获取检索关键词,并根据所述检索关键词提取得到用户的用户特征向量,所述检索关键词指示了所述用户请求检索的信息;按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;通过包含所述检索关键词的目标搜索子图,从信息库中得到所述用户请求检索的信息。

【技术特征摘要】
1.一种信息检索方法,其特征在于,包括:获取检索关键词,并根据所述检索关键词提取得到用户的用户特征向量,所述检索关键词指示了所述用户请求检索的信息;按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;通过包含所述检索关键词的目标搜索子图,从信息库中得到所述用户请求检索的信息。2.如权利要求1所述的方法,其特征在于,所述按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群,包括:将所述用户的用户特征向量分别输入至用户分类模型的若干单高斯模型,计算得到所述用户针对不同单高斯模型的若干先验概率值,所述单高斯模型与用户群一一对应;根据若干所述先验概率值判断所述用户的用户特征向量是否符合所述用户分类模型;如果所述用户的用户特征向量符合所述用户分类模型,则计算所述用户针对不同单高斯模型的若干后验概率值;将计算得到后验概率值最大的单高斯模型所对应的用户群作为所述用户所属的候选用户群。3.如权利要求2所述的方法,其特征在于,所述按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群,还包括:设置若干用户群,并根据若干所述用户群创建包含若干单高斯模型的混合高斯模型,所述单高斯模型与所述用户群一一对应;获取样本信息,并根据所述样本信息进行用户特征向量提取;根据提取得到的用户特征向量对引入加速因子的所述混合高斯模型进行模型训练;当所述混合高斯模型的参数在所述加速因子作用下使得最大似然函数的期望达到最大时,将所述混合高斯模型作为所述用户分类模型,所述最大似然函数是根据提取得到的用户特征向量计算的。4.如权利要求1所述的方法,其特征在于,所述获取为所述候选用户群建立的搜索子图集合,包括:对所述候选用户群对应的知识图谱中节点进行遍历,以遍历到的节点作为初始节点;将所述初始节点添加至已选节点集合,并将所述知识图谱中所述初始节点的相邻节点添加至候选节点集合;根据所述已选节点集合和所述候选节点集合对所述知识图谱进行搜索子图划分;待所述知识图谱中的节点完成遍历,得到为所述候选用户群建立的所述搜索子图集合,所述搜索子图集合包含至少一搜索子图。5.如权利要求4所述的方法,其特征在于,所述根据所述已选节点集合和所述候选节点集合对所述知识图谱进行搜索子图划分,包括:如果所述候选节点集合非空,则对非空的所述候选节点集合中候选节点进行...

【专利技术属性】
技术研发人员:胡伟凤高雪松
申请(专利权)人:海信集团有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1