一种基于深度学习的产品数据清洗方法及系统技术方案

技术编号：33726676 阅读：56 留言：0更新日期：2022-06-08 21:20

本发明专利技术提供了一种基于深度学习的产品数据清洗方法及系统，方法包括以下步骤：按行业建立产品数据集，基于深度学习模型建立数据清洗模型，并利用数据清洗模型对产品数据集进行训练，得到训练数据集和测试数据集；获取需要清洗的产品数据并将其输入到训练好的数据清洗模型，得到产品清洗结果；按照物料属性对产品清洗结果进行循环交叉验证，直至不存在异常数据后输出清洗结果。本发明专利技术预先建立一基于机械加工和装配制造产品数据结构的深度学习数据集，所述数据集包含行业标准产品数据以及历史项目制造产品数据；然后通过数据集的数据清洗模型对所述项目的产品数据进行清洗。洗模型对所述项目的产品数据进行清洗。洗模型对所述项目的产品数据进行清洗。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的产品数据清洗方法及系统

[0001]本专利技术涉及数据清洗
，尤其是一种基于深度学习的产品数据清洗方法及系统。

技术介绍

[0002]数据清洗：对数据进行重新审查和校验的过程，目的在于删除重复信息、纠正存在的错误，并提供数据一致性。数据导入后的数据清理一般是由计算机而不是人工完成。
[0003]物料(item)：这里的物料是指产品生产过程中所要用到或消耗掉的所有物料，它包括最终产品、部件、组件、复合件、零件、外购件、原材料等。
[0004]物料主文件(item data)：用来标识与描述用于生产过程中的每项物料的属性和信息，物料主文件主要包含：
[0005]1)基本信息：物料编码、物料类型、物料分类、物料名称。
[0006]2)设计管理有关信息：如设计图号或配方(原料、成分)号、设计修改号或版次、物料的生效日期和失效日期等。
[0007]3)物料管理有关信息：如计量单位、材质、规格、成品率、ABC码、默认的仓库和或为、分类吗、现有库存量、安全库存、最长存储天数、最大库存量限额、循环盘点间隔期等。
[0008]物料清单(Bill of Material，简称BOM)：BOM是对产品组成结构的描述，它列明了生产一个产品所需要所有子部件、中间件、零件、原材料的列表，它显示了组成这个父零件所需子件的数量。有时也称为“配方表”、“配套表”、“产品结构表”、“详表”“产品明细清单”等。
[0009]产品数据：
[0010]制造业ERP系统中生

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的产品数据清洗方法，其特征是，包括以下步骤：S1，按行业建立产品数据集，基于深度学习模型建立数据清洗模型，并利用数据清洗模型对产品数据集进行训练，得到训练数据集和测试数据集；S2，获取需要清洗的产品数据并将其输入到训练好的数据清洗模型，得到产品清洗结果；S3，按照物料属性对产品清洗结果进行循环交叉验证，直至不存在异常数据后输出清洗结果。2.根据权利要求1所述的一种基于深度学习的产品数据清洗方法，其特征是，所述S1包括以下步骤：A1：按行业建立产品数据集，所述产品数据集包括行业标准产品数据以及历史项目制造产品数据；A2：按物料的属性制定标签；A3：把产品数据集按分类与标签建立分类学习器；A4：通过深度学习模型对产品数据集进行训练，得到训练结果；建立函数M
i
＝AF(∑
j
X
ij
t
k
+b
j
)，其中t是产品库数量，k是产品BOM的层级，X是标签数据集，AF是激活函数；A5：训练结果经专家数据库校对后输出为训练通过的数据集；A6：将训练通过的数据集拆分为训练数据和测试数据。3.根据权利要求2所述的一种基于深度学习的产品数据清洗方法，其特征是，所述物料的属性包括物料的材质、规格、类型、大类。4.根据权利要求1所述的一种基于深度学习的产品数据清洗方法，其特征是，所述S3包括以下步骤：运用K
‑
fold Cross Validation交叉...

【专利技术属性】
技术研发人员：吕勋，郑沁，周建波，李伯鸣，王燕灵，
申请(专利权)人：杭州新中大科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人