基于工业制造大数据的不平衡数据学习方法技术

技术编号：19694148 阅读：24 留言：0更新日期：2018-12-08 11:46

本发明专利技术公开了基于工业制造大数据的不平衡数据学习方法，包括以下步骤101、确定工业制造大数据的采集源及采集方式：102、按照步骤101的采集方式从采集源获取工业制造大数据以构成不平衡数据集；103、通过抽样机制来修改不平衡数据集，以提供平衡的数据分布；104、将所述不平衡数据集引入SFBP代价矩阵框架，通过代价矩阵框架元素的逐项搜索比较，对每行和每列中满足约束条件的元素个数进行计数；通过比较每行每列满足约束条件的元素个数所占每行每列的比例，对SFBP代价矩阵框架添加相应的代价值行列数，改变其代价矩阵框架，以优化不平衡数据集的平衡度。

全部详细技术资料下载

【技术实现步骤摘要】
基于工业制造大数据的不平衡数据学习方法
本专利技术涉及工业制造大数据处理领域，尤其是基于工业制造大数据的不平衡数据学习方法。
技术介绍
不平衡学习问题主要关注数据表示不充分和类分布扭曲变形时学习算法的性能。制造业在测控网和测控数据方面，由于来自不同设备并且针对不同对象，呈现典型的不平衡形式。由于不平衡数据集固有的复杂特点，学习这样的数据需要将大量原始数据高效转化为信息和知识表示的新理解、新原理、新算法和新工具。
技术实现思路
为了克服上述现有技术中的不足，本专利技术提供了一种基于工业制造大数据的不平衡数据学习方法。本专利技术解决其技术问题所采用的技术方案为：基于工业制造大数据的不平衡数据学习方法，包括以下步骤101、确定工业制造大数据的采集源及采集方式：102、按照步骤101的采集方式从采集源获取工业制造大数据以构成不平衡数据集；103、通过抽样机制来修改不平衡数据集，以提供平衡的数据分布；104、将所述不平衡数据集引入SFBP代价矩阵框架，通过代价矩阵框架元素的逐项搜索比较，对每行和每列中满足约束条件的元素个数进行计数；通过比较每行每列满足约束条件的元素个数所占每行每列的比例，对SFBP代价矩阵框架添加相应的代价值行列数，改变其代价矩阵框架，以优化不平衡数据集的平衡度。所述抽样机制包括随机过抽样和欠抽样、伴随数据生成的合成抽样、自适应合成抽样、数据清理抽样、基于聚类的抽样和Boosting集成抽样。所述代价矩阵的构建过程具体包括如下步骤：步骤1、设定的插入操作代价值Ci和删除操作代价值Cd；步骤2、构建SFBP算法的原始代价矩阵；步骤3、逐行逐列统计原始代价...

【技术保护点】
1.基于工业制造大数据的不平衡数据学习方法，其特征在于：包括以下步骤101、确定工业制造大数据的采集源及采集方式：102、按照步骤101的采集方式从采集源获取工业制造大数据以构成不平衡数据集；103、通过抽样机制来修改不平衡数据集，以提供平衡的数据分布；104、将所述不平衡数据集引入SFBP代价矩阵框架，通过代价矩阵框架元素的逐项搜索比较，对每行和每列中满足约束条件的元素个数进行计数；通过比较每行每列满足约束条件的元素个数所占每行每列的比例，对SFBP代价矩阵框架添加相应的代价值行列数，改变其代价矩阵框架，以优化不平衡数据集的平衡度。

【技术特征摘要】
1.基于工业制造大数据的不平衡数据学习方法，其特征在于：包括以下步骤101、确定工业制造大数据的采集源及采集方式：102、按照步骤101的采集方式从采集源获取工业制造大数据以构成不平衡数据集；103、通过抽样机制来修改不平衡数据集，以提供平衡的数据分布；104、将所述不平衡数据集引入SFBP代价矩阵框架，通过代价矩阵框架元素的逐项搜索比较，对每行和每列中满足约束条件的元素个数进行计数；通过比较每行每列满足约束条件的元素个数所占每行每列的比例，对SFBP代价矩阵框架添加相应的代价值行列数，改变其代价矩阵框架，以优化不平衡数据集的平衡度。2.根据权利要求1所述的基于工业制造大数据的不平衡数据学习方法，其特征在于：所述抽样机制包括随机过抽样和欠抽样、伴随数据生成的合成抽样、自适应合成抽样、数据清理抽样、基于聚类的抽样和Boosting集成抽样。3.根据权利要求1所述的基于工业制造大数据的不平衡数据学习方法，其特征在于：所述代价矩阵的构建过程具体包括如下步骤：步骤1、设定的插入操作代价值Ci和删除操作代价值Cd；步...

【专利技术属性】
技术研发人员：张彩霞，王向东，王新东，胡绍林，
申请(专利权)人：佛山科学技术学院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人