【技术实现步骤摘要】
一种面向协同制造企业的非结构化图表数据分析方法
[0001]本专利技术涉及大数据处理
,尤其涉及一种面向协同制造企业的非结构化图表数据分析方法。
技术介绍
[0002]随着信息通信技术和大数据技术的发展,制造企业管理过程的信息化和智能化程度不断提高。使用数据分析和数据管理方法将企业中离散多源的数据资源转化为数据知识用于生产运营决策已成为企业智能化转型的关键。网络化协同制造作为一种信息高度集成的智能制造模式,也极大地促进制造企业的智能发展。协同制造中的协同层可以获取到各个生产车间甚至是企业间的生产信息资源,实现生产资源交互整合和协调管控,从而提高企业资源利用能效。在这些信息资源中,可视化图表作为一种直观简单的展示数值数据的方式,被广泛应用在数据分析工作中,并作为重要的非结构化数据在企业间的协同过程中进行数据整合。由于数据格式的特殊性,对图表信息的分析应用常存在以下问题:一是图表的原始数据难以获得。由于图表的原始数据来自于不同企业或者车间的生产系统,因此在获取原始数据时需要访问不同生产系统的数据接口,并需要企业开放数据访问 ...
【技术保护点】
【技术特征摘要】
1.一种面向协同制造企业的非结构化图表数据分析方法,其特征在于,包括如下步骤:获取非结构化图表数据;通过光学字符识别技术和深度学习的卷积神经网络对所述非结构化图表数据进行文本提取,得到文本信息,其中,文本信息包括文本内容信息和文本位置信息;通过基于沙漏网络的关键点检测网络模型对所述非结构化图表数据进行关键点提取,得到关键点特征数据;将所述关键点特征数据和所述文本信息进行结合整理,得到图表信息,其中图表信息包括图表基础信息和数值信息;通过基于深度学习的预训练的自然语言生成模型对图表信息进行处理,得到所述非结构化图表数据的图表分析文本。2.根据权利要求1所述的面向协同制造企业的非结构化图表数据分析方法,其特征在于,所述通过光学字符识别技术和深度学习的卷积神经网络对所述非结构化图表数据进行文本提取,得到文本信息的步骤,包括:对非结构化图表数据进行预处理操作,所述预处理操作包括图像的缩放和裁剪;对预处理后的非结构化图表数据进行二值化处理;使用基于深度学习的文本像素分类器去除二值化处理后的非结构化图表数据中的非文本像素,获得仅保留了文本像素的纯净图像;通过光学字符识别技术识别所述纯净图像中的文本,得到文本信息。3.根据权利要求2所述的面向协同制造企业的非结构化图表数据分析方法,其特征在于,所述文本信息的类型为4种,包括:图表标题、图例、x轴以及y轴;文本信息的类型是使用径向基核函数训练支持向量机对提取到的文本元素进行分类得到的。4.根据权利要求1所述的面向协同制造企业的非结构化图表数据分析方法,其特征在于,所述通过基于沙漏网络的关键点检测网络模型对所述非结构化图表数据进行关键点提取,得到关键点特征数据的步骤,包括:通过沙漏网络对非结构化图表数据进行一系列的下采样操作和上采样操作处理,得到将非结构化图表数据的关键点位置像素高亮的概率特征图;将所述概率特征图作为输入经过关键点检测网络模型的左上角预测模块和右上角预测模块,得到所述概率特征图的热力特征图、嵌入特征图和偏移特征图;根据关键点检测网络模型的热力特征图、嵌入特征图和偏移特征图得到关键点特征数据。5.根据权利要求4所述的面向协同制造企业的非结构化图表数据分析方法,其特征在于,所述关键点检测网络模型包括沙漏网络、下采样操作层、上采样操作层、特征提取操作层、特征保存操作层构成。6.根据权利要求4所述的面向协同制造企业的非结构化图表数据分析方法,其特征在于,所述根据热力特征图、嵌入特征图和偏移特征图得到关键点特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。