一种数据清洗方法、系统及设备技术方案

技术编号:23149052 阅读:64 留言:0更新日期:2020-01-18 13:27
本发明专利技术提供一种原材料数据清洗方法、系统及设备,包括有;采集高炉炼铁过程中的原材料检化验成分数据;建立数据清洗模型,数据清洗模型包括有用于检测原材料检化验成分完整性的第一子模型、用于检测原材料检化验成分范围的第二子模型和用于检测原材料检化验成分百分比累加值的第三子模型;将原材料检化验成分数据输入至数据清洗模型中的一个或多个子模型,获取对应子模型的检测结果;根据子模型的检测结果对原材料检化验成分数据进行清洗。本发明专利技术通过对检化验成分的完整性检测、范围检测和累加值检测,能够剔除或过滤部分错误的、不完整的检化验成分数据,降低了对以检化验成分数据为计算基础的理论模型的影响。

A data cleaning method, system and equipment

【技术实现步骤摘要】
一种数据清洗方法、系统及设备
本专利技术涉及数据清洗
,特别是涉及一种高炉炼铁用的原材料数据清洗方法、系统及设备。
技术介绍
在高炉炼铁过程中,钢铁生产企业会预先采购原材料,并将采购的原材料存放至原料场。并且,钢铁生产企业中的检验人员或化验人员会对原料场中的原材料进行取样和化验,得到原材料检化验成分数据;并将原材料检化验成分数据录入至钢铁生产企业的管理系统中。但在上述操作过程中,在取样和化验过程中,可能因为检验人员或化验人员的失误导致原材料检化验成分数据错误;在原材料检化验成分数据录入管理系统过程中,可能由于录入人员的失误将正确的原材料检化验成分数据录入错误;以及在原材料检化验成分数据录入管理系统过程中,录入的原材料检化验成分数据超出了预期时间,导致录入的原材料检化验成分数据出现滞后,从而造成原材料检化验成分数据未录入或录入原材料检化验成分数据不成功等问题。上述问题造成的错误检化验成分数据将会影响钢铁生产过程中以检化验成分数据为计算基础的理论模型,理论模型例如包括有原材料的上料数据统计、理论出铁量的计算、理论燃料比的计算等。然而上述问题在本文档来自技高网...

【技术保护点】
1.一种原材料数据清洗方法,其特征在于,包括有:/n采集高炉炼铁过程中的原材料检化验成分数据;/n建立数据清洗模型,所述数据清洗模型包括有用于检测原材料检化验成分完整性的第一子模型、用于检测原材料检化验成分范围的第二子模型和用于检测原材料检化验成分百分比累加值的第三子模型;/n将原材料检化验成分数据输入至数据清洗模型中的一个或多个子模型,获取对应子模型的检测结果;根据子模型的检测结果对原材料检化验成分数据进行清洗。/n

【技术特征摘要】
1.一种原材料数据清洗方法,其特征在于,包括有:
采集高炉炼铁过程中的原材料检化验成分数据;
建立数据清洗模型,所述数据清洗模型包括有用于检测原材料检化验成分完整性的第一子模型、用于检测原材料检化验成分范围的第二子模型和用于检测原材料检化验成分百分比累加值的第三子模型;
将原材料检化验成分数据输入至数据清洗模型中的一个或多个子模型,获取对应子模型的检测结果;根据子模型的检测结果对原材料检化验成分数据进行清洗。


2.根据权利要求1所述的原材料数据清洗方法,其特征在于,将原材料检化验成分数据分别输入至第一子模型、第二子模型和第三子模型中;
若第一子模型检测到原材料检化验成分数据存在不完整、第二子模型检测到原材料检化验成分数据存在错误、第三子模型检测到原材料检化验成分数据存在错误;
则根据第一子模型、第二子模型和/或第三子模型的检测结果对原材料检化验成分数据进行清洗。


3.根据权利要求1或2所述的原材料数据清洗方法,其特征在于,第一子模型对原材料检化验成分的完整性检测,包括有:
将获取的原材料检化验成分数据作为当前原材料检化验成分数据输入至第一子模型中;
将所述当前原材料检化验成分数据与预设原材料检化验成分数据进行比对,获取比对结果;
若比对结果中,当前原材料检化验成分数据中原材料种类缺少一类以上;和/或,当前原材料检化验成分数据中检化验成分项缺少一项以上;则第一子模型将当前原材料检化验成分数据标记为不完整;第一子模型输出的检测结果为当前原材料检化验成分数据不完整。


4.根据权利要求1或2所述的原材料数据清洗方法,其特征在于,第二子模型对原材料检化验成分的范围检测,包括有:
将获取的原材料检化验成分数据作为当前原材料检化验成分数据输入至第二子模型中;
将所述当前原材料检化验成分数据与预设原材料检化验成分数据进行比对,获取比对结果;
若比对结果中,当前原材料检化验成分数据中存在一项以上的检化验成分的数值未位于预设原材料检化验成分数据范围内,则第二子模型将当前原材料检化验成分数据标记为错误;第二子模型输出的检测结果为当前原材料检化验成分数据错误。


5.根据权利要求1或2所述的原材料数据清洗方法,其特征在于,第三子模型对原材料检化验成分的百分比累加值检测,包括有:
将获取的原材料检化验成分数据作为当前原材料检化验成分数据输入至第三子模型中;
将所述当前原材料检化验成分数据与预设原材料检化验成分数据进行比对,获取比对结果;
若比对结果中,若当前原材料检化验成分数据中各项检化验成分的百分比累加值小于预设阈值,则第三子模型将当前原材料检化验成分数据标记为错误;第三子模型输出的检测结果为当前原材料检化验成分数据错误。

【专利技术属性】
技术研发人员:孙小东周洪安赵宽王劲松杨博刘中保胡梅甘鹏王刚谢皓
申请(专利权)人:中冶赛迪重庆信息技术有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1