信息处理方法和装置、存储介质及电子设备制造方法及图纸

技术编号:38992028 阅读:26 留言:0更新日期:2023-10-07 10:22
本申请公开了一种信息处理方法和装置、存储介质及电子设备。其中,该方法包括:接收搜索信息;通过目标推荐算法对搜索信息进行处理,得到搜索结果,目标推荐算法是由多个目标数据信息构建的训练样本集对初始推荐算法进行迭代训练得到,多个目标数据信息通过对多个历史数据信息进行筛选得到,历史数据信息中至少包括:多个搜索结果集和针对多个搜索结果集中的搜索结果的行为反馈数据,其中,行为反馈数据用于表征搜索结果是否被选中;展示搜索结果。本申请解决了在部署算法模型之后,直接通过用户的反馈数据对算法模型进行迭代更新,导致迭代更新后的算法模型输出的搜索结果的准确率比较低的技术问题。比较低的技术问题。比较低的技术问题。

【技术实现步骤摘要】
信息处理方法和装置、存储介质及电子设备


[0001]本申请涉及人工智能
,具体而言,涉及一种信息处理方法和装置、存储介质及电子设备。

技术介绍

[0002]面向企业的行业解决方案中包含了大量的智能算法模型。这些模型部署到客户现场上线后,通常需要根据客户任务、数据的变化不断地迭代升级以保持较好的效果。普遍的做法是人工收集用户的反馈,构建错误样本集,然后在客户环境重新训练模型。这里一个重大的挑战是大部分客户都缺少GPU资源,并且考虑到成本,能用于训练模型的CPU和内存资源也非常少。而现在主流的算法模型参数越来越多,需要的数据量越来越大,训练时间越来越长。比如一个1亿参数的BERT(Bidirectional Encoder Representation from Transformers)模型,训练样本100万条,在4核16G内存的机器上训练一轮就要十几天。在现有技术中是在模型上线后周期性地收集一批样本,然后在客户的机器上利用这些样本重新训练模型。但是这种做法下,对样本不进行筛选就进行训练,或者以人为主观挑选样本,导致训练样本不但数量巨大(尤本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:接收搜索信息;通过目标推荐算法对所述搜索信息进行处理,得到搜索结果,其中,所述目标推荐算法是由多个目标数据信息构建的训练样本集对初始推荐算法进行迭代训练得到,所述多个目标数据信息通过对多个历史数据信息进行筛选得到,依据所述历史数据信息的目标匹配度对所述多个历史数据信息进行筛选,所述目标匹配度表征所述历史数据信息对应的搜索结果集与历史搜索信息的匹配程度,所述历史数据信息中至少包括:通过所述初始推荐算法对多个历史搜索信息输出的多个搜索结果集和针对所述多个搜索结果集中的搜索结果的行为反馈数据,其中,所述行为反馈数据用于表征所述搜索结果是否被选中;展示所述搜索结果。2.根据权利要求1所述的方法,其特征在于,在通过目标推荐算法对所述搜索信息进行处理,得到搜索结果之前,所述方法还包括:获取所述多个历史数据信息;对所述多个历史数据信息进行筛选处理,得到所述多个目标数据信息,并依据所述多个目标数据信息构建所述训练样本集,其中,所述训练样本集中包括多个训练样本,所述训练样本由所述历史搜索信息、所述历史搜索信息对应的第一正样本以及所述历史搜索信息对应的第一负样本组成,所述第一正样本为依据所述行为反馈数据确定的所述多个搜索结果集中被选中的搜索结果,所述第一负样本为依据所述行为反馈数据确定的所述多个搜索结果集中未被选中的搜索结果;依据所述训练样本集对所述初始推荐算法进行迭代训练,得到目标推荐算法。3.根据权利要求2所述的方法,其特征在于,对所述多个历史数据信息进行筛选处理,得到多个目标数据信息包括:对于多个历史数据信息中的历史数据信息,依据所述行为反馈数据和/或所述历史数据信息对应的搜索结果集中的搜索结果,确定所述历史数据信息对应的目标匹配度,其中,所述目标匹配度表征所述搜索结果集与所述历史搜索信息的匹配程度;依据所述目标匹配度对所述多个历史数据信息进行筛选,得到所述多个目标数据信息。4.根据权利要求3所述的方法,其特征在于,对于多个历史数据信息中的历史数据信息,依据所述行为反馈数据和/或所述多个搜索结果集中的搜索结果,确定所述历史数据信息对应的目标匹配度,采用的方式为如下至少之一:对于多个历史数据信息中的历史数据信息,依据所述行为反馈数据,确定所述历史数据信息对应的搜索结果集中的搜索结果是否被选中,以及若所述历史数据信息对应的搜索结果集中的搜索结果被选中,则确定被选中的搜索结果在所述历史数据信息对应的搜索结果集中的排列次序,并依据所述搜索结果是否被选中和所述被选中的搜索结果在所述多个搜索结果集中的排列次序,确定所述历史数据信息对应的目标匹配度;对于多个历史数据信息中的历史数据信息,依据所述行为反馈数据和所述历史数据信息对应的搜索结果集中的目标搜索结果,确定所述历史数据信息对应的目标匹配度;对于多个历史数据信息中的历史数据信息,依据所述历史数据信息对应的搜索结果集中的搜索结果对应的类别信息,得到所述历史数据信息对应的目标匹配度。
5.根据权利要求4所述的方法,其特征在于,对于多个历史数据信息中的历史数据信息,依据所述行为反馈数据和所述历史数据信息对应的搜索结果集中的目标搜索结果,确定所述历史数据信息对应的目标匹配度包括:对于多个历史数据信息中的历史数据信息,依据所述行为反馈数据,确定历史数据信息对应的搜索结果集中的目标搜索结果;确定所述目标搜索结果在所述历史数据信息对应的搜索结果集中的排列次序;依据所述排列次序对所述历史数据信息对应的搜索结果集与所述历史搜索信息之间的匹配程度进行计算,得到所述历史数据信息的目标匹配度。6.根据权利要求4所述的方法,其特征在于对于多个历史数据信息中的历史数据信息,依据所述历史数据信息对应的搜索结果集中的搜索结果对应的类别信息,得到所述历史数据信息对应的目标匹配度包括:对于多个历史数据信息中的历史数据信息,获...

【专利技术属性】
技术研发人员:周益锋
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1