数据处理方法及装置、电子设备和存储介质制造方法及图纸

技术编号:34949563 阅读:29 留言:0更新日期:2022-09-17 12:26
本公开涉及一种数据处理方法及装置、电子设备和存储介质,所述方法包括:根据获取的目标对象的初始评价数据集,判断初始评价数据集是否满足预设的有效数据集条件,在初始评价数据集满足预设的有效数据集条件的情况下,剔除初始评价数据集中的异常评价数据,得到待处理的第一评价数据集,并对第一评价数据集进行多元线性回归处理,确定多元线性回归模型,显示多元线性回归模型的N个权值的占比。本公开实施例可综合考虑目标对象的多种感官属性喜好度,使得到的多元线性回归模型更精准也更加符合真实业务需求。合真实业务需求。合真实业务需求。

【技术实现步骤摘要】
数据处理方法及装置、电子设备和存储介质


[0001]本公开涉及计算机
,尤其涉及一种数据处理方法及装置、电子设备和存储介质。

技术介绍

[0002]在快消品行业内,对于产品消费者喜好驱动因素的定量分析,主要依赖于双变量的一元相关性分析,以皮尔森线性相关为主。这种方式虽然简单便捷,但是无法揭示多变量间的关系。
[0003]例如,影响用户对一款奶粉感官喜好度的因素可能有很多,如冲调性、甜味、奶香味、腥味等。双变量的一元相关性分析只能揭示某一个感官属性喜好度与综合喜好度之间的相关关系,或者某二个感官属性喜好度之间的相关关系。

技术实现思路

[0004]本公开提出了一种数据处理技术方案。
[0005]根据本公开的一方面,提供了一种数据处理方法,包括:获取目标对象的初始评价数据集,所述初始评价数据集包括多个用户的评价数据,每个评价数据包括所述用户对所述目标对象的综合喜好度,以及对所述目标对象的N个感官属性喜好度,每个感官属性喜好度对应于用户对目标对象的一种类型的感官属性的喜好程度,N为大于0的整数;判断所述初始评价数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取目标对象的初始评价数据集,所述初始评价数据集包括多个用户的评价数据,每个评价数据包括所述用户对所述目标对象的综合喜好度,以及对所述目标对象的N个感官属性喜好度,每个感官属性喜好度对应于用户对目标对象的一种类型的感官属性的喜好程度,N为大于0的整数;判断所述初始评价数据集是否满足预设的有效数据集条件;在所述初始评价数据集满足预设的有效数据集条件的情况下,剔除所述初始评价数据集中的异常评价数据,得到待处理的第一评价数据集;对所述第一评价数据集进行多元线性回归处理,确定多元线性回归模型,所述多元线性回归模型用于表示所述综合喜好度与所述N个感官属性喜好度之间的关系,所述多元线性回归模型包括与所述N个感官属性喜好度分别对应的N个权值;显示所述多元线性回归模型的所述N个权值的占比。2.根据权利要求1所述的方法,其特征在于,所述对所述第一评价数据集进行多元线性回归处理,确定多元线性回归模型,包括:根据所述第一评价数据集,构建M个第二评价数据集,所述第二评价数据集包括训练集和验证集;分别对所述M个第二评价数据集的训练集进行多元线性回归处理,确定M个初始多元线性回归模型;根据M个第二评价数据集的验证集,分对M个初始多元线性回归模型进行验证处理,确定每个初始多元线性回归模型的误差;在M个所述误差的均值小于第一预设阈值的情况下,根据M个初始多元线性回归模型,确定所述多元线性回归模型,所述多元线性回归模型的N个权值为对应的所述M个初始多元线性回归模型的N个权值的均值。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一评价数据集,构建M个第二评价数据集,所述第二评价数据集包括训练集和验证集,包括:针对任一第二评价数据集,从所述第一评价数据集中随机选取预设比例的评价数据作为所述第二评价数据集的训练集,并将剩余部分作为所述第二评价数据集的验证集。4.根据权利要求1所述的方法,其特征在于,在所述判断所述初始评价数据集是否满足预设的有效数据集条件之前,所述方法还包括:分别对所述N个感官属性喜好度与所述综合喜好度进行相关性分析,确定所述N个感官属性喜好度对应的N个相关系数;所述判断所述初始评价数据集是否满足预设的有效数据集条件,包括:在所述N个相关系数均大于第二预设阈值的情况下,所述初始评价数据集满足预设的有效数据集条件。5.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:邢昊魏巧思陈维强陆思宇张永久冷友斌
申请(专利权)人:黑龙江飞鹤乳业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1