【技术实现步骤摘要】
搜索信息处理方法、装置、产品、设备和介质
[0001]本申请涉及计算机
,尤其涉及一种搜索信息处理方法、装置、产品、设备和介质。
技术介绍
[0002]随着计算机技术的不断发展,搜索引擎的性能也在不断优化。对于搜索引擎的前端通常可以根据用户输入的搜索信息,给用户返回相应的搜索结果列表,而对于搜索引擎的后端则需要对用户输入的搜索信息进行关键数据的提取,以根据提取的关键数据来召回该搜索信息的搜索结果。而由于千千万万的用户输入的搜索信息可能也会千差万别,因此如何对各式各样的搜索信息包含的关键数据进行更准确的提取,进而基于提取的关键数据召回搜索信息更准确的搜索结果成为一个亟待解决的问题。
技术实现思路
[0003]本申请提供了一种搜索信息处理方法、装置、产品、设备和介质,可提升训练后的搜索召回网络的准确性,从而提升采用训练后的搜索召回网络提取搜索信息包含的关键数据的准确性,进而提升基于提取的关键数据召回搜索信息的搜索结果的准确性。
[0004]本申请一方面提供了一种搜索信息处理方法,该方法包括: >[0005]获取搜本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种搜索信息处理方法,其特征在于,所述方法包括:获取搜索信息簇;所述搜索信息簇包含N个搜索信息,N为正整数;所述N个搜索信息之间具有相同的关联搜索结果,任一搜索信息的关联搜索结果包括基于所述任一搜索信息召回的搜索结果列表中被触发有关联操作的搜索结果;调用搜索召回网络分别提取所述搜索信息簇中每个搜索信息的关键数据,并基于所述N个搜索信息的关键数据之间的数据分布确定所述搜索信息簇的参考关键数据;将所述参考关键数据设置为所述搜索信息簇中的目标搜索信息的标签数据;所述目标搜索信息是指所述搜索信息簇中关键数据与所述参考关键数据不一致的搜索信息;基于具有标签数据的所述目标搜索信息训练所述搜索召回网络,得到训练后的搜索召回网络;所述训练后的搜索召回网络用于提取搜索信息包含的关键数据,该关键数据用于召回该搜索信息的搜索结果。2.根据权利要求1所述的方法,其特征在于,所述获取搜索信息簇,包括:获取信息集;所述信息集包含M个搜索信息及所述M个搜索信息中每个搜索信息的关联搜索结果;M为正整数且M大于或等于N;对所述M个搜索信息中具有相同的关联搜索结果的搜索信息进行聚合处理,得到一个或多个所述搜索信息簇。3.根据权利要求2所述的方法,其特征在于,所述M个搜索信息中任两个搜索信息表示为第一搜索信息和第二搜索信息;所述对所述M个搜索信息中具有相同的关联搜索结果的搜索信息进行聚合处理,得到一个或多个所述搜索信息簇,包括:根据所述第一搜索信息和所述第二搜索信息具有的相同的关联搜索结果,获取所述第一搜索信息和所述第二搜索信息之间的数据相关性;若所述数据相关性的数值大于或等于相关性阈值,则将所述第一搜索信息和所述第二搜索信息聚合到相同的搜索信息簇中。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一搜索信息和所述第二搜索信息具有的相同的关联搜索结果,获取所述第一搜索信息和所述第二搜索信息之间的数据相关性,包括:获取针对所述第一搜索信息的第一搜索频率,并获取针对所述第二搜索信息的第二搜索频率;获取所述第一搜索信息和所述第二搜索信息具有的相同的关联搜索结果的共现频率;基于所述第一搜索频率、所述第二搜索频率和所述共现频率,计算所述第一搜索信息和所述第二搜索信息之间的所述数据相关性。5.根据权利要求4所述的方法,其特征在于,所述第一搜索频率是指所述第一搜索信息的搜索次数与所述M个搜索信息的总搜索次数之间的比值,所述第二搜索频率是指所述第二搜索信息的搜索次数与所述总搜索次数之间的比值;所述共现频率是指目标共现次数与总共现次数之间的比值,所述目标共现次数是指所述第一搜索信息与所述第二搜索信息具有的相同的关联搜索结果召回后被触发所述关联操作的次数,所述总共现次数是指所述M个搜索信息中两两组合的搜索信息对应的共现次数的总和。
6.根据权利要求4所述的方法,其特征在于,所述基于所述第一搜索频率、所述第二搜索频率和所述共现频率,计算所述第一搜索信息和所述第二搜索信息之间的数据相关性,包括:获取所述第一搜索频率与所述第二搜索频率的乘积,作为针对所述第一搜索信息和所述第二搜索信息的综合搜索频率;基于所述共现频率与所述综合搜索频率之间的比值,确定所述第一搜索信息和所述第二搜索信息之间的所述数据相关性。7.根据权利要求3所述的方法,其特征在于,若所述数据相关性的数值大于或等于相关性阈值,则将所述第一搜索信息和所述第二搜索信息聚合到相同的搜索信息簇中,包括:若所述数据相关性大于或等于所述相关性阈值,则根据所述第一搜索信息和所述第二搜索信息构建所述M个搜索信息的搜索信息对;将基于所述M个搜索信息构建的多个搜索信息对中具有相同搜索信息的搜索信息对进行合并,得到一个或多个所述搜索信息簇。8.根据权利要求7所述的方法,其特征在于,基于所述M个搜索信息构建的任一个搜索信息对表示为目标搜索信息对;所述将基于所述M个搜索信息构建的多个搜索信息对中具有相同搜索信息的搜索信息对进行合并,得到一个或多个所述搜索信息簇,包括:获取所述目标搜索信息对包含的两个搜索信息的数据重合度;若所述数据重合度小于或等于重合度阈值,则将所述目标搜索信息对从基于所述M个搜索信息构建的多个搜索信息对中进行过滤,得到过滤后的搜索信息对;对所述过滤后的搜索信息对中具有相同搜索信息的搜索信息对进行合并,得到一个或多个所述搜索信息簇。9.根据权利要...
【专利技术属性】
技术研发人员:黄淼鑫,黄泽谦,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。