【技术实现步骤摘要】
一种基于大数据的信息收集分析方法及系统
本专利技术涉及数据处理
,特别是涉及一种基于大数据的信息收集分析方法及系统。
技术介绍
重工业是为国民经济各部门提供物质技术基础的主要生产资料的工业。它为国民经济各部门(包括工业本身)提供原材料、动力、技术装备等劳动资料和劳动对象,是实现社会再生产和扩大再生产的物质基础。其中,重工业包括钢铁工业、冶金工业、机械、能源(电力、石油、煤炭、天然气等)、化学、材料等工业。在冶金工业方面,由于冶金涉及多个工序,会产生大量的数据,且这些数据来源不相同,往往出现多个数据源之间数据核对不一致,数据质量难以保障等,难以进行科研管理、经营管理,不方便冶金企业做出合适的经营的决策。因此,本专利技术提出一种基于大数据的信息收集分析方法及系统。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于大数据的信息收集分析方法及系统,用于解决现有技术中存在的问题。为实现上述目的及其他相关目的,本专利技术提供一种基于大数据的信息收集分析方法,包括以下步骤: >采集钢铁冶炼过程中本文档来自技高网...
【技术保护点】
1.一种基于大数据的信息收集分析方法,其特征在于,包括以下步骤:/n采集钢铁冶炼过程中各个工序产生的数据,并根据所有工序产生的数据组成数据集;/n计算所述数据集中某工序产生的数据值与该工序的参考值之间的差值,并将该差值确定为第一差值;若某工序中一数据的第一差值的绝对值大于或等于第一预设阈值,则对该数据进行第一类标记;/n以所述数据集中某工序前一时刻产生的数据值为基准值,计算该工序后一时刻产生的数据值与该基准值的差值,并将该差值确定为第二差值;若某工序中一数据的第二差值的绝对值大于或等于第二预设阈值,则对该数据进行第二类标记;/n获取所述数据集中存在第一类标记的数据、存在第二 ...
【技术特征摘要】
1.一种基于大数据的信息收集分析方法,其特征在于,包括以下步骤:
采集钢铁冶炼过程中各个工序产生的数据,并根据所有工序产生的数据组成数据集;
计算所述数据集中某工序产生的数据值与该工序的参考值之间的差值,并将该差值确定为第一差值;若某工序中一数据的第一差值的绝对值大于或等于第一预设阈值,则对该数据进行第一类标记;
以所述数据集中某工序前一时刻产生的数据值为基准值,计算该工序后一时刻产生的数据值与该基准值的差值,并将该差值确定为第二差值;若某工序中一数据的第二差值的绝对值大于或等于第二预设阈值,则对该数据进行第二类标记;
获取所述数据集中存在第一类标记的数据、存在第二类标记的数据和不存在标记的数据,基于存在第一类标记的数据、存在第二类标记的数据和不存在标记的数据进行多维度分析,并以可视化的图和/或表显示分析结果。
2.根据权利要求1所述的基于大数据的信息收集分析方法,其特征在于,还包括确定所述数据集中某一工序的参考值,有:
获取所述数据集中某一工序产生的所有数据;
计算该工序的数据平均值,将计算出的数据平均值作为该工序的参考值。
3.根据权利要求1所述的基于大数据的信息收集分析方法,其特征在于,还包括根据标记类别对所述数据集中的数据进行分类,有:
获取所述数据集;
若对所述数据集中的某一数据进行标记类别与已有标记类别属于同一类别,则将该数据聚类至已有标记类别中;
若对所述数据集中的某一数据进行标记类别与已有标记类别不属于同一类别,则新增加一个标记类别,并将该数据添加至新增加的标记类别中。
4.根据权利要求1所述的基于大数据的信息收集分析方法,其特征在于,还包括分析某一工序是否中断数据的产生;
获取所述数据集中某一工序产生的全部数据,并对该工序产生的全部数据按照产生时间进行依次编号;
判断所述某一工序的数据编号长度与该工序的预设数据编号长度是否一致;
若该工序的数据编号长度大于或等于该工序的预设数据编号长度,则确定该工序未中断数据的产生;
若该工序的数据编号长度小于该工序的预设数据编号长度,则确定该工序中断数据的产生。
5.根据权利要求1所述的基于大数据的信息收集分析方法,其特征在于,对所述数据集中的数据进行标记前,还按照字段匹配算法、优先队列算法、近邻排序算法、多趟近邻排序算法...
【专利技术属性】
技术研发人员:胡清蕾,
申请(专利权)人:山东博远数据服务有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。