【技术实现步骤摘要】
信息检索方法及装置
本专利技术涉及信息检索领域,尤其涉及一种信息检索方法及装置。
技术介绍
随着计算机技术的发展,知识图谱作为语义知识查询的基础被越来越广泛地应用到了信息检索领域,即信息库中存储数以百万计的信息,并为此构建相关联的知识图谱,以供用户根据输入的检索信息对知识图谱进行全图查询,进而从知识图谱相关联的信息库中得到相关信息。例如,电视用户可以通过输入自己喜爱的演员名字而在信息库中检索到与演员相关的电视节目。然而,面临海量用户频繁地请求对知识图谱进行全图查询,将造成知识图谱的查询速度出现瓶颈,进而影响信息检索效率。
技术实现思路
为了解决上述技术问题,本专利技术的一个目的在于提供一种信息检索方法及装置。其中,本专利技术所采用的技术方案为:一方面,一种信息检索方法,包括:获取检索关键词,并根据所述检索关键词提取得到所述用户的用户特征向量,所述检索关键词指示了用户请求检索的信息;按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;通过包含所述检索关键词的目标搜索子图从信息库中得到所述用户请求检索的信息。在一示例性实施例中,所述按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群,包括:将所述用户的用户特征向量分别输入至用户分类模型的若干单高斯模型,计算得到所述用户针对不同单高斯模型的若干先验概率值,所述单高斯模型与用户群一一对应;根据若干所述先验概率值判断所述用户的 ...
【技术保护点】
1.一种信息检索方法,其特征在于,包括:获取检索关键词,并根据所述检索关键词提取得到用户的用户特征向量,所述检索关键词指示了所述用户请求检索的信息;按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;通过包含所述检索关键词的目标搜索子图,从信息库中得到所述用户请求检索的信息。
【技术特征摘要】
1.一种信息检索方法,其特征在于,包括:获取检索关键词,并根据所述检索关键词提取得到用户的用户特征向量,所述检索关键词指示了所述用户请求检索的信息;按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群;获取为所述候选用户群建立的搜索子图集合,并按照所述检索关键词对所述搜索子图集合中的搜索子图进行全图查询,得到包含所述检索关键词的目标搜索子图;通过包含所述检索关键词的目标搜索子图,从信息库中得到所述用户请求检索的信息。2.如权利要求1所述的方法,其特征在于,所述按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群,包括:将所述用户的用户特征向量分别输入至用户分类模型的若干单高斯模型,计算得到所述用户针对不同单高斯模型的若干先验概率值,所述单高斯模型与用户群一一对应;根据若干所述先验概率值判断所述用户的用户特征向量是否符合所述用户分类模型;如果所述用户的用户特征向量符合所述用户分类模型,则计算所述用户针对不同单高斯模型的若干后验概率值;将计算得到后验概率值最大的单高斯模型所对应的用户群作为所述用户所属的候选用户群。3.如权利要求2所述的方法,其特征在于,所述按照所述用户的用户特征向量对所述用户进行用户分类,确定所述用户所属的候选用户群,还包括:设置若干用户群,并根据若干所述用户群创建包含若干单高斯模型的混合高斯模型,所述单高斯模型与所述用户群一一对应;获取样本信息,并根据所述样本信息进行用户特征向量提取;根据提取得到的用户特征向量对引入加速因子的所述混合高斯模型进行模型训练;当所述混合高斯模型的参数在所述加速因子作用下使得最大似然函数的期望达到最大时,将所述混合高斯模型作为所述用户分类模型,所述最大似然函数是根据提取得到的用户特征向量计算的。4.如权利要求1所述的方法,其特征在于,所述获取为所述候选用户群建立的搜索子图集合,包括:对所述候选用户群对应的知识图谱中节点进行遍历,以遍历到的节点作为初始节点;将所述初始节点添加至已选节点集合,并将所述知识图谱中所述初始节点的相邻节点添加至候选节点集合;根据所述已选节点集合和所述候选节点集合对所述知识图谱进行搜索子图划分;待所述知识图谱中的节点完成遍历,得到为所述候选用户群建立的所述搜索子图集合,所述搜索子图集合包含至少一搜索子图。5.如权利要求4所述的方法,其特征在于,所述根据所述已选节点集合和所述候选节点集合对所述知识图谱进行搜索子图划分,包括:如果所述候选节点集合非空,则对非空的所述候选节点集合中候选节点进行...
【专利技术属性】
技术研发人员:胡伟凤,高雪松,
申请(专利权)人:海信集团有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。