【技术实现步骤摘要】
模板生成方法、装置、电子设备及存储介质
[0001]本公开涉及计算机
本公开尤其涉及智能搜索、智能推荐领域。
技术介绍
[0002]在搜索领域中,通过对用户搜索文本的统计分析,当用户对于某种信息或资源有特定意图时,使用的搜索文本会符合某种特定的模式。将这些具有相同模式的文本归纳起来形成一种模板的形式,使用模板可以比较方便地识别用户的意图。然而,如何高效并且准确的生成模板就成为需要解决的问题。
技术实现思路
[0003]本公开提供了一种模板生成方法、装置、电子设备、存储介质及计算机程序产品。
[0004]根据本申请的第一方面,提供了一种模板生成方法,包括:
[0005]获取M个历史搜索文本以及所述M个历史搜索文本分别对应的点击资源;M为大于等于1的整数;
[0006]基于所述M个历史搜索文本分别对应的所述点击资源的相关信息对所述M个历史搜索文本进行聚类,得到N个样本集;N为大于等于1的整数;
[0007]基于所述N个样本集中分别包含的多个历史搜索文本,确定所述N个样本集分别相关的目标模板以及所述目标模板的词槽中包含的同类词语。
[0008]根据本申请的第二方面,提供了一种模板生成装置,包括:
[0009]信息获取模块,用于获取M个历史搜索文本以及所述M个历史搜索文本分别对应的点击资源;M为大于等于1的整数;
[0010]聚类模块,用于基于所述M个历史搜索文本分别对应的所述点击资源的相关信息对所述M个历史搜索文本进行聚类,得到N个样本集;N为
【技术保护点】
【技术特征摘要】
1.一种模板生成方法,包括:获取M个历史搜索文本以及所述M个历史搜索文本分别对应的点击资源;M为大于等于1的整数;基于所述M个历史搜索文本分别对应的所述点击资源的相关信息对所述M个历史搜索文本进行聚类,得到N个样本集;N为大于等于1的整数;基于所述N个样本集中分别包含的多个历史搜索文本,确定所述N个样本集分别相关的目标模板以及所述目标模板的词槽中包含的同类词语。2.根据权利要求1所述的方法,其中,所述基于所述M个历史搜索文本分别对应的所述点击资源的相关信息对所述M个历史搜索文本进行聚类,得到N个样本集,包括:基于所述M个历史搜索文本分别对应的所述点击资源的相关信息对所述M个历史搜索文本进行聚类,得到K个候选样本集;K为大于等于N的整数;从所述K个候选样本集中,选取所述N个样本集。3.根据权利要求2所述的方法,其中,所述从所述K个候选样本集中,选取所述N个样本集,包括以下至少之一:对所述K个候选样本集中的第i个候选样本集中包含的历史搜索文本的数量进行统计,在所述历史搜索文本的数量达到第一预设数量的情况下,将所述第i个候选样本集作为所述N个样本集中之一;i为大于等于1且小于等于K的整数;对所述K个候选样本集中的第i个候选样本集中包含的目标类型的历史搜索文本的数量进行统计,在所述目标类型的历史搜索文本的数量达到第二预设数量的情况下,将所述第i个候选样本集作为所述N个样本集中之一:获取所述K个候选样本集中的第i个候选样本集中包含的历史搜索文本所关联的用户标识,对所述历史搜索文本所关联的用户标识去重后得到用户标识的数量,在所述用户标识的数量达到第三预设数量的情况下,将所述第i个候选样本集作为所述N个样本集中之一。4.根据权利要求1所述的方法,其中,所述基于所述N个样本集中分别包含的多个历史搜索文本,确定所述N个样本集分别相关的目标模板以及所述目标模板的词槽中包含的同类词语,包括:基于所述N个样本集中的第j个样本集包含的L个历史搜索文本,确定所述第j个样本集相关的候选模板以及所述候选模板的词槽中包含的候选同类词语;j为大于等于1且小于等于N的整数;L为大于等于1的整数;从所述候选模板中选取模板置信度大于模板置信度阈值的候选模板作为所述第j个样本集相关的目标模板;以及从所述第j个样本集相关的所述目标模板的所述词槽中包含的所述候选同类词语中选取词语置信度大于词语置信度阈值的候选同类词语,作为所述目标模板的所述词槽中包含的所述同类词语。5.根据权利要求4所述的方法,其中,所述基于所述N个样本集中的第j个样本集包含的L个历史搜索文本,确定所述第j个样本集相关的候选模板以及所述候选模板的词槽中包含的候选同类词语,包括:基于所述第j个样本集包含的所述L个历史搜索文本分别对应的分词结果,确定第k组共现词;k为大于等于1的整数;
将所述第j个样本集中包含所述第k组共现词的P个历史搜索文本作为第k个子样本集;P为大于等于1且小于等于L的整数;基于所述第k个子样本集的所述P个历史搜索文本分别对应的分词结果确定除所述第k组共现词之外的第一类词语,基于所述第k组共现词以及所述第一类词语,确定第k组候选模板以及所述第k组候选模板中各个候选模板的词槽中的初始词语;基于所述第j个样本集中的所述L个历史搜索文本分别对应的分词结果、以及所述第k组候选模板中所述各个候选模板的词槽中的初始词语,确定所述第k组候选模板中所述各个候选模板的所述词槽中分别包含的所述候选同类词语。6.根据权利要求1
‑
5任一项所述的方法,其中,所述方法还包括:基于所述N个样本集分别相关的所述目标模板更新模板树;基于所述N个样本集分别相关的所述目标模板的所述词槽中包含的所述同类词语更新词槽树。7.根据权利要求6所述的方法,其中,所述方法还包括:在接收到当前搜索文本的情况下,基于所述词槽树以及所述模板树确定所述当前搜索文本所对应的意图识别结果。8.一种模板生成装置,包括:信息获取模块,用于获取M个历史搜索文本以及所述M个历史搜索文本分别对应的点击资源;M为大于等于1的整数;聚类模块,用于...
【专利技术属性】
技术研发人员:潘秋桐,李瑞高,李雅楠,何伯磊,刘准,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。