A method of data analysis of mobile labeling detection based on FP Growth algorithm: S1, preprocessing the database of detection results of mobile labeling detection system; S2, the frequent predicate sets of each sub data cube are identified by FP Growth algorithm for each sub data cube; S3, multiple sub data cubes will be used. The frequent predicate sets are merged into the frequent predicate sets of the data cube; after S4, the frequent predicate sets of the data cube are obtained, and the relationship between the unqualified and the unqualified factors is determined by the calculation. The invention can deal with mass historical data, and the results are comprehensive, true and reliable; the support degree of the data cube is obtained, and the calculation is simplified. The FP Growth algorithm is reformed to produce only the strong association between the unqualified type and the unqualified factors, without the unqualified factors and the unqualified factors. The strong correlation between them accelerated the operation speed of the system.
【技术实现步骤摘要】
一种基于FP-Growth算法的手机贴标检测数据分析方法
本专利技术涉及一种基于FP-Growth算法的手机贴标检测数据分析方法,属于数据处理
技术介绍
随着移动互联网的发展,手机已成为人们生活中必不可少的消费品。全球手机需求爆发性增长推动了整个手机产业的蓬勃发展。为了满足人们对手机的需求,手机制造商需要加快手机研发速度和生产速度。在手机的生产流水线上,手机制造商需要将多个标签附于手机上。但是,由于贴标人员的粗心,贴标人员往往会出现贴标不合格的情况。为了提高手机产品出厂合格率,需要对手机贴标进行检测。数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。随着手机生产量的迅速增加,手机贴标检测数据呈现爆发式增长,传统的数据统计分析方法已经不再适用于海量手机贴标检测数据的相关分析。而随着检测数据数量的增多,数据之间的相关关系也愈专利技术显,所以,亟需一种适用于海量检测数据的数据分析方法研究手机贴标不合格的关键因素。
技术实现思路
本专利技术的主要目的是在于提供一种基于FP-Growth算法的手机贴标检测数据分析方法,旨在对手机制造商手机贴标部门的检测数据进行数据挖掘和分析,从而为手机生产商贴标流水线的调整提供数据支持。为了实现上述目的,本专利技术提供的一种基于FP-Growth算法的手机贴标检测数据分析方法,包括以下步骤:S1,对手机贴标检测系统检测结果数据库进行预处理;具体如下:S11,剔除手机贴标检测合格的相关结果,保留手机贴标检测不合格的相关结果;S12,提取检测结果中贴标不合格的类型及相关的贴标人 ...
【技术保护点】
1.一种基于FP‑Growth算法的手机贴标检测数据分析方法,其特征在于:该方法包括以下步骤:S1,对手机贴标检测系统检测结果数据库进行预处理;具体如下:S11,剔除手机贴标检测合格的相关结果,保留手机贴标检测不合格的相关结果;S12,提取检测结果中贴标不合格的类型及相关的贴标人员年龄、性别、工位编号以及贴标时间等信息;S13,将提取的数据进行处理,具体包括对缺失值和异常值的整条数据记录删除;S14,将处理后的数据通过OLAP数据建模工具Workbench生成一个五维数据立方体;S15,对得到的五维数据立方体按照不合格类型维中的成员进行OLAP切片操作,得到每个不合格类型维成员所对应的四维子数据立方体;S2,对每个子数据立方体应用FP‑Growth算法统计识别出每个子数据立方体的频繁谓词集;基于FP‑Growth算法的子数据立方体的频繁谓词集的统计识别步骤如下:S21,设定FP‑Growth算法的最小支持度;S22,第一次扫描子数据立方体,计算每个维成员的支持度,并与设定的最小支持度比较得到1‑项频繁谓词集;S23,第二次扫描子数据立方体,创建FP‑tree;S24,从FP‑tree中 ...
【技术特征摘要】
1.一种基于FP-Growth算法的手机贴标检测数据分析方法,其特征在于:该方法包括以下步骤:S1,对手机贴标检测系统检测结果数据库进行预处理;具体如下:S11,剔除手机贴标检测合格的相关结果,保留手机贴标检测不合格的相关结果;S12,提取检测结果中贴标不合格的类型及相关的贴标人员年龄、性别、工位编号以及贴标时间等信息;S13,将提取的数据进行处理,具体包括对缺失值和异常值的整条数据记录删除;S14,将处理后的数据通过OLAP数据建模工具Workbench生成一个五维数据立方体;S15,对得到的五维数据立方体按照不合格类型维中的成员进行OLAP切片操作,得到每个不合格类型维成员所对应的四维子数据立方体;S2,对每个子数据立方体应用FP-Growth算法统计识别出每个子数据立方体的频繁谓词集;基于FP-Growth算法的子数据立方体的频繁谓词集的统计识别步骤如下:S21,设定FP-Growth算法的最小支持度;S22,第一次扫描子数据立方体,计算每个维成员的支持度,并与设定的最小支持度比较得到1-项频繁谓词集;S23,第二次扫描子数据立方体,创建FP-tree;S24,从FP-tree中挖掘子数据立方体的频繁谓词集;S3,将上述步骤得到的多个子数据立方体的频繁谓词集合并为数据立方体的频繁谓词集;S31,遍历每个子数据立方体的频繁谓词集列表,若子数据立方体的频繁谓词集列表存在相同的频繁谓词集,则将该频繁谓词集的支持度相加,得到只包含不合格因素的频繁谓词集;S32,将每个子数据立方体的频繁谓词集加上对应的不合格类型组成新的频繁谓词集,即包含有不合格因素和不合格类型的频繁谓词集;S4,得到数据立方体的频繁谓词集后,通过计算判定不合格类型b与不合格因素a的关系强弱。2.根据权利要求1所述的一种基于FP-Growth算法的手机贴标检测数据分析方法,其特征在于:所述步骤S1...
【专利技术属性】
技术研发人员:余旸,梁帆,乔仁晓,王国华,
申请(专利权)人:深圳灵虎至真智能科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。