【技术实现步骤摘要】
内容搜索方法、装置、电子设备、存储介质及程序产品
[0001]本申请涉及搜索及人工智能
,具体而言,本申请涉及一种内容搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]在搜索领域中,为便于用户查找相关内容,一般会设定分类标准对搜索结果进行类目结构的搭建,生成相应的类目树。基于类目的属性,类目树可以对应于包括多层级的结构。
[0003]在现有技术中,通过类目树确定与搜索文本相应的类目的搜索结果时,存在类目树父子节点一致性差的问题,导致所确定的搜索结果准确度不高。
技术实现思路
[0004]本申请实施例提供了一种内容搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决现有技术中类目树父子节点一致性差导致所确定搜索结果准确度低的技术问题。所述技术方案如下:
[0005]根据本申请实施例的一个方面,提供了一种内容搜索方法,该方法包括:
[0006]获取输入的搜索信息;
[0007]识别所述搜索信息的搜索意图;
[000 ...
【技术保护点】
【技术特征摘要】
1.一种内容搜索方法,其特征在于,包括:获取输入的搜索信息;识别所述搜索信息的搜索意图;在所述搜索意图对应的类目树的各类目层级中,确定所述搜索信息对应的第一分类节点;基于所述第一分类节点在所述类目树中进行回溯,得到所述各类目层级对应的第二分类节点;在所述第二分类节点与第一分类节点相应时,基于所述第一分类节点或第二分类节点中的至少一个分类节点对应的类目信息,确定与所述搜索信息相应的搜索结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一分类节点在所述类目树中进行回溯,得到所述各类目层级对应的第二分类节点,包括以下其中一项:基于所述第一分类节点中的叶子节点,向所述类目树中根节点逐层级进行递归回溯,得到所述各类目层级对应的第二分类节点;针对各所述第一分类节点在所述类目树对应的类目层级中进行层级间回溯,得到各所述第一分类节点的父节点;将所述叶子节点与所述父节点确定为所述各类目层级对应的第二分类节点;其中,所述层级间回溯为自所述第一分类节点起向上一层级回溯。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一分类节点或第二分类节点中的至少一个分类节点对应的类目信息,确定与所述搜索信息相应的搜索结果,包括:基于叶子节点对应的类目信息,确定与所述搜索信息相应的搜索结果;其中,所述叶子节点为所述第一分类节点或第二分类节点在所述类目树中所对应层级最深的分类节点。4.根据权利要求1所述的方法,其特征在于,所述在所述搜索意图对应的类目树的各类目层级中,确定所述搜索信息对应的第一分类节点,包括:提取所述搜索信息的第一语义特征;基于所述第一语义特征通过预构建的分类器在所述搜索意图对应的类目树中,确定各类目层级与第一语义特征对应的第一分类节点;其中,所述分类器为叶子节点结构的分类器。5.根据权利要求4所述的方法,其特征在于,所述提取所述搜索信息的第一语义特征,包括:通过预构建的语言模型提取所述搜索信息的第一语义特征;其中,所述语言模型的训练步骤包括:采用第一样本语料进行训练,得到初始语言模型;所述第一样本语料包括与搜索场景相关且未标注样本语义信息的文本语料;采用第二样本语料对所述初始语言模型进行训练,得到训练后的语言模型;所述第二样本语料包括与搜索场景相关且已标注样本语义信息的文本语料;其中,所述采用第二样本语料对所述初始语言模型进行训练,包括:采用所述初始语言模型对所述第二样本语料进行语义预测,得到预测语义信息;基于所述预测语义信息与样本语义信息计算损失值,并基于该损失值调整所述初始语言模型的网络参数。6.根据权利要求4所述的方法,其特征在于,所述分类器包括第一分类器,该第一分类器的训练步骤包括:
获取第一训练数据;所述第一训练数据包括第一样本搜索信息、在所述搜索意图对应的类目树的各类目层级中与所述第一样本搜索信息对应的第一样本分类节点;采用第一训练数据训练所述第一分类器,得到在所述搜索意图对应的类目树的各类目层级中确定与所述第一样本搜索信息对应的第一预测分类节点相应的预测概率;基于所述第一样本分类节点与所述预测概率的对数变换特征值计算所得的第一损失值,调整所述第一分类器的网络参数。7.根据权利要求4所述的方法,其特征在于,所述分类器包括第二分类器,该第二分类器的训练步骤包括:获取第二训练数据;所述第二训练数据包括第二样本搜索信息、在所述搜索意图对应的类目树的各类目层级中与所述第二样本搜...
【专利技术属性】
技术研发人员:朱秀红,张伟,易磊,黄锦鸿,黄泽谦,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。