一种模型更新参数的确定方法、确定装置及可读存储介质制造方法及图纸

技术编号:26173109 阅读:30 留言:0更新日期:2020-10-31 13:54
本申请提供了一种模型更新参数的确定方法、确定装置及可读存储介质,通过确定待更新模型的预测事件,以及与预测事件相关的多个特征维度和在每个特征维度下的多个候选特征;基于确定出的每一个特征维度与预测结果之间的相关度;从多个候选特征中筛选出多个模型更新特征;将多个模型更新特征作为输入,与每个模型更新特征对应的预测结果作为输出,对待更新模型进行训练,得到待更新模型训练完毕的更新数据,可以随着特征与预测结果关系的变化选择对预测结果重要的特征对模型进行更新,从而保持甚至提升模型的预测效果,提高了模型更新的准确性,同时有助于保证线上服务的低时延,降低服务超时的概率。

【技术实现步骤摘要】
一种模型更新参数的确定方法、确定装置及可读存储介质
本申请涉及计算机处理
,具体而言,涉及一种模型更新参数的确定方法、确定装置及可读存储介质。
技术介绍
随着深度学习模型技术的成熟,越来越多的
利用训练好的模型实现多种功能,模型可以根据输入的相应数据,对应的输出一个预测结果,在模型的使用过程中,为了提升模型的预测准确率,需要定期对模型进行更新。现阶段,模型使用的特征数据等都是固定的,对于模型的更新,大都是通过最新的特征数据对模型进行训练,仅是数据的数值发生变化,来得到模型的更新数据,这样,模型的预测事件中预测结果和预测因素之间一成不变,预测事件的可用信息僵化,导致模型的预测准确率不稳定,甚至在一定时间段后,模型的预测准确率会大幅降低。
技术实现思路
有鉴于此,本申请的目的在于提供一种模型更新参数的确定方法、确定装置及可读存储介质,根据在需要进行模型更新时不同特征维度与预测结果之间的相关度,筛选得到的模型更新特征,以对模型训练得到模型的更新数据,这样,可以随着特征与预测结果关系的变化选择对预测结果重要的特征对模型进行更新,从而保持甚至提升模型的预测效果,提高了模型更新的准确性,同时有助于保证线上服务的低时延,降低服务超时的概率。根据本申请的第一方面,提供了一种模型更新参数的确定方法,所述确定方法包括:确定待更新模型的预测事件,以及与所述预测事件相关的多个特征维度和在每个特征维度下的多个候选特征;确定每一个特征维度与预测结果之间的相关度;基于确定出的每一个特征维度与预测结果之间的相关度,从多个候选特征中筛选出多个模型更新特征;将所述多个模型更新特征作为输入,将与每个模型更新特征对应的预测结果作为输出,对所述待更新模型进行训练,得到所述待更新模型训练完毕的更新数据。在本申请的一些实施例中,在所述将将所述多个模型更新特征作为输入,将与每个模型更新特征对应的预测结果作为输出,对所述待更新模型进行训练,得到所述待更新模型训练完毕的更新数据之后,所述确定方法包括:当确定所述待更新模型满足更新条件时,使用所述更新数据更新对所述待更新模型进行数据更新,确定更新后的出行预测模型。在本申请的一些实施例中,在所述当确定所述待更新模型满足更新条件时,使用所述更新数据对所述待更新模型进行数据更新,确定更新后的出行预测模型之后,所述确定方法包括:获取待预测出行事件以及所述待预测出行事件的出行数据;基于确定出的每一个特征维度与预测结果之间的相关度,从所述出行数据中确定出所述待预测出行事件的多个目标出行特征;将多个目标出行特征输入至所述出行预测模型中,得到所述待预测出行事件的出行预测结果。在本申请的一些实施例中,通过以下步骤确定所述待更新模型满足更新条件:获取所述待更新模型在使用中的模型历史数据;检测所述模型历史数据指示的历史预测特征与历史预测结果之间的历史映射关系,与所述更新数据指示的更新预测特征与更新预测结果之间的更新映射关系是否匹配,以及所述模型历史数据指示的历史模型参数与所述更新数据指示的模型更新参数是否匹配;若所述历史映射关系与所述更新映射关系不匹配,或者所述历史模型参数与所述模型更新参数不匹配,确定所述待更新模型满足更新条件。在本申请的一些实施例中,通过以下步骤确定每一个特征维度与预测结果之间的相关度:从样本数据库中获取所述预测事件的样本数据;基于所述多个特征维度以及所述样本数据,确定出多个样本特征数据;基于每一个特征维度以及多个样本特征数据,构建至少一个决策树;基于构建的所述至少一个决策树中,每一个特征维度被划分在对应节点分支下的划分属性,确定每一个特征维度与预测结果之间的相关度。在本申请的一些实施例中,所述划分属性包括划分次数、节点分裂增益以及样本覆盖比例中的至少一种。在本申请的一些实施例中,当所述划分属性包括划分次数时,通过以下步骤确定特征维度与预测结果之间的相关度:针对每一个特征维度,确定在所述至少一个决策树中该特征维度被划分在决策树中各节点下的划分次数;将所述划分次数确定为该特征维度与预测结果之间的相关度,其中,所述划分次数越多,该特征维度与预测结果之间的相关度越高。在本申请的一些实施例中,当所述划分属性包括节点分裂增益时,通过以下步骤确定特征维度与预测结果之间的相关度:获取在构建所述至少一个决策树的过程中,确定在每一个特征维度被划分在决策树中对应节点下时,该节点的节点分裂增益;针对于每一个特征维度,将与该特征维度对应的每一个节点的节点分裂增益加和后取平均值,得到该特征维度对应的平均节点分裂增益;将所述平均节点分裂增益确定为该特征维度与预测结果之间的相关度,其中,所述平均节点分裂增益越大,该特征维度与预测结果之间的相关度越高。在本申请的一些实施例中,当所述划分属性包括样本覆盖比例时,通过以下步骤确定特征维度与预测结果之间的相关度:针对每一个特征维度,确定该特征维度被划分在对应节点下时,在每个节点下能够使用的样本特征数据的样本数量;基于每个节点下的样本数量,确定与该特征维度对应的至少一个节点下的样本总数,以及所述样本总数占输入的所述多个样本特征数据中总样本数量的样本覆盖比例;将所述样本覆盖比例,确定为该特征维度与预测结果之间的相关度,其中,所述样本覆盖比例越高,该特征维度与预测结果之间的相关度越高。在本申请的一些实施例中,所述基于确定出的每一个特征维度与预测结果之间的相关度,从多个候选特征中筛选出多个模型更新特征,包括:将每一个特征维度与预测结果之间的相关度按照从大到小的顺序排序,并从所述多个特征维度中筛选出相关度在预设排序位置之前的至少一个目标特征维度;将至少一个目标特征维度下的全部候选特征确定为多个模型更新特征。在本申请的一些实施例中,通过以下步骤确定所述待更新模型训练完毕:确定在所述多个模型更新特征作为输入后,每一个模型更新特征对应的预测结果的预测准确率;将所述预测准确率按照从大到小的顺序排列,确定预测准确率在预设序列位置之前的多个目标预测准确率;将在使用中待更新模型的当前准确率按照从大到小的顺序排序,确定当前准确率在预设序列位置之前的多个目标当前准确率;计算位于同一序列位置的目标预测准确率与目标当前准确率之间的准确率偏差值,并检测每一个准确率偏差值是否大于预设偏差阈值;若每一个准确率偏差值均大于预设偏差阈值,确定所述待更新模型训练完毕。根据本申请的第二方面,提供了一种模型更新参数的确定装置,所述确定装置包括:特征筛选模块,用于确定待更新模型的预测事件,以及与所述预测事件相关的多个特征维度和在每个特征维度下的多个候选特征;相关度确定模块,用于确定每一个特征维度与预测结果之间的相关度;更新特征筛选模块,用于基于确定出的每一个特征维度与预测结果之间的相关度,从本文档来自技高网...

【技术保护点】
1.一种模型更新参数的确定方法,其特征在于,所述确定方法包括:/n确定待更新模型的预测事件,以及与所述预测事件相关的多个特征维度和在每个特征维度下的多个候选特征;/n确定每一个特征维度与预测结果之间的相关度;/n基于确定出的每一个特征维度与预测结果之间的相关度,从多个候选特征中筛选出多个模型更新特征;/n将所述多个模型更新特征作为输入,将与每个模型更新特征对应的预测结果作为输出,对所述待更新模型进行训练,得到所述待更新模型训练完毕的更新数据。/n

【技术特征摘要】
1.一种模型更新参数的确定方法,其特征在于,所述确定方法包括:
确定待更新模型的预测事件,以及与所述预测事件相关的多个特征维度和在每个特征维度下的多个候选特征;
确定每一个特征维度与预测结果之间的相关度;
基于确定出的每一个特征维度与预测结果之间的相关度,从多个候选特征中筛选出多个模型更新特征;
将所述多个模型更新特征作为输入,将与每个模型更新特征对应的预测结果作为输出,对所述待更新模型进行训练,得到所述待更新模型训练完毕的更新数据。


2.根据权利要求1所述的确定方法,其特征在于,在所述将所述多个模型更新特征作为输入,将与每个模型更新特征对应的预测结果作为输出,对所述待更新模型进行训练,得到所述待更新模型训练完毕的更新数据之后,所述确定方法还包括:
当确定所述待更新模型满足更新条件时,使用所述更新数据对所述待更新模型进行数据更新,确定更新后的出行预测模型。


3.根据权利要求2所述的确定方法,其特征在于,在所述当确定所述待更新模型满足更新条件时,使用所述更新数据对所述待更新模型进行数据更新,确定更新后的出行预测模型之后,所述确定方法包括:
获取待预测出行事件以及所述待预测出行事件的出行数据;
基于确定出的每一个特征维度与预测结果之间的相关度,从所述出行数据中确定出所述待预测出行事件的多个目标出行特征;
将多个目标出行特征输入至所述出行预测模型中,得到所述待预测出行事件的出行预测结果。


4.根据权利要求2所述的确定方法,其特征在于,通过以下步骤确定所述待更新模型满足更新条件:
获取所述待更新模型在使用中的模型历史数据;
检测所述模型历史数据指示的历史预测特征与历史预测结果之间的历史映射关系,与所述更新数据指示的更新预测特征与更新预测结果之间的更新映射关系是否匹配,以及所述模型历史数据指示的历史模型参数与所述更新数据指示的模型更新参数是否匹配;
若所述历史映射关系与所述更新映射关系不匹配,或者所述历史模型参数与所述模型更新参数不匹配,确定所述待更新模型满足更新条件。


5.根据权利要求1或3所述的确定方法,其特征在于,通过以下步骤确定每一个特征维度与预测结果之间的相关度:
从样本数据库中获取所述预测事件的样本数据;
基于所述多个特征维度以及所述样本数据,确定出多个样本特征数据;
基于每一个特征维度以及多个样本特征数据,构建至少一个决策树;
基于构建的所述至少一个决策树中,每一个特征维度被划分在对应节点分支下的划分属性,确定每一个特征维度与预测结果之间的相关度。


6.根据权利要求5所述的确定方法,其特征在于,所述划分属性包括划分次数、节点分裂增益以及样本覆盖比例中的至少一种。


7.根据权利要求6所述的确定方法,其特征在于,当所述划分属性包括划分次数时,通过以下步骤确定特征维度与预测结果之间的相关度:
针对每一个特征维度,确定在所述至少一个决策树中该特征维度被划分在决策树中各节点下的划分次数;
将所述划分次数确定为该特征维度与预测结果之间的相关度,其中,所述划分次数越多,该特征维度与预测结果之间的相关度越高。


8.根据权利要求6所述的确定方法,其特征在于,当所述划分属性包括节点分裂增益时,通过以下步骤确定特征维度与预测结果之间的相关度:
获取在构建所述至少一个决策树的过...

【专利技术属性】
技术研发人员:徐江王鹏李奘
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1