一种基于工业互联网的数据识别方法技术

技术编号:30321146 阅读:18 留言:0更新日期:2021-10-09 23:43
本发明专利技术公开了一种基于工业互联网的数据识别方法,涉及数据识别技术领域。本发明专利技术包括如下步骤:访问工业互联网的网络设备和主机,获取网络设备和主机的ID、描述文件、服务接口以及联网对象;使用以太网通讯接口采集设备工作过程中的输出信号,制成网络数据集合;将网络数据集合成训练样本集生成数据识别模型的网络结构;网络数据集合对具有子网络结构的数据识别模型进行训练以确定子网络结构中每个节点处的操作的参数,从而生成数据识别模型。本发明专利技术通过获取网络设备和主机的ID、描述文件、服务接口以及联网对象,并结合输出信号制成网络数据集合作为训练集,用来训练出数据识别模型,提高了数据识别的速度和精准度。提高了数据识别的速度和精准度。提高了数据识别的速度和精准度。

【技术实现步骤摘要】
一种基于工业互联网的数据识别方法


[0001]本专利技术属于数据识别
,特别是涉及一种基于工业互联网的数据识别方法。

技术介绍

[0002]工业互联网是全球工业系统与高级计算、分析、感应技术以及互联网连接融合的一种结果。工业互联网的本质是通过开放的、全球化的工业级网络平台把设备、生产线、工厂、供应商、产品和客户紧密地连接和融合起来,高效共享工业经济中的各种要素资源,从而通过自动化、智能化的生产方式降低成本、增加效率,帮助制造业延长产业链,推动制造业转型发展。
[0003]经过多年工业互联网的安全建设,运营商根据自身需求构建出完整的安全控制体系和系统,特别是在数据安全方面已经成为安全建设的重中之重,但随着业务不断壮大,数据安全防护要求也越来越高。主要体现为以下两个方面:(1)数据模型快速膨胀加大了管控难度:随着工业设备的快速发展,需要对数据模型进行快速变更和迭代、以适应业务需求,但往往无论是设计人员还是运维人员都无法从全局视角理解数据模型,从而不得不使用“打补丁”的方式来维护数据模型;(2)数据不能精准地识别:目前数据识别主要依赖于字典匹配法和人工识别的方法,但这两种方法都无法达到很好的效果,主要体现在:

识别精度低,字典匹配采用的是模式化匹配的方式,因此数据字典建立决定了识别精准度,当字典不完整或有误时,会出现识别进度降低的问题;

识别速度慢,周期长,且对处理人员专业素质要求较高;

评判标准不统一,导致设备识别结果具有差异性。
专利技术内容
[0004]本专利技术的目的在于提供一种基于工业互联网的数据识别方法,通过获取网络设备和主机的ID、描述文件、服务接口以及联网对象,并结合输出信号制成网络数据集合作为训练集,用来训练出数据识别模型,解决了现有的工业设备繁多导致的数据不能精准识别的问题。
[0005]为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为一种基于工业互联网的数据识别方法,包括如下步骤:步骤S1:访问工业互联网的网络设备和主机,获取网络设备和主机的ID、描述文件、服务接口以及联网对象;步骤S2:使用以太网通讯接口采集设备工作过程中的输出信号;步骤S3:将获取到的ID、描述文件、服务接口、联网对象和输出信号进行预处理,制成网络数据集合;步骤S4:将网络数据集合成训练样本集生成数据识别模型的网络结构;步骤S5:基于要识别的数据类型确定要生成的数据识别模型的网络结构参数空间
并且从网络结构的参数空间中采样得到具有规模的子网络结构的参数,并根据子网络结构的参数构建用于数据识别模型的网络结构,得到子网络结构的每个结点处的操作;步骤S6:网络数据集合对具有子网络结构的数据识别模型进行训练以确定子网络结构中每个节点处的操作的参数,从而生成数据识别模型。
[0006]优选地,所述步骤S1中,所述网络设备和主机的ID为工业互联网中设备的全局唯一标识;所述描述文件为工业互联网中表述设备特性和功能的数字化说明书;所述服务接口为工业互联网中设备与互联网之间进行数据和信息检索、查询、交互的接口;所述联网对象为具有通信能力的目标对象。
[0007]优选地,所述步骤S2中,采集设备工程过程中的输出信号的采集装置包括:主控单元和分别与主控单元连接的模拟信号放大单元、开关量信号采集单元、输出单元和通讯单元;所述采集装置通过主控单元内部设置的放大器或通过模拟信号放大单元对外部模拟信号进行放大采集,同时对外部开关量信号进行采集,然后将采集到的外部信号传输给上级设备。
[0008]优选地,所述步骤S3中,预处理包括对获取到的ID、描述文件、服务接口、联网对象和输出信号依次进行数据清洗、数据集成、数据变化和数据规约,经过预处理后的数据能够制作成JSON数据集。
[0009]优选地,所述步骤S4中,训练样本集需要先进行复杂度计算,并基于复杂度计算更新后的训练样本集生成的数据识别模型的网络结构的规模。
[0010]优选地,所述复杂度为类内复杂度、类间复杂度或类内复杂度与类间复杂度之组合。
[0011]优选地,所述网络结构的规模通过网络层数和通道数来表示数据识别模型的规模;所述网络结构的参数空间包括网络层数、通道数、每一层网络采用的张量操作方式以及各个层网络之间的连接方式,所述网络结构的参数空间每部分有特定取值范围的数字表示,由所述网络结构的参数空间的各个部分的确定取值的数字构成的向量代表确定的一种子网络结构。
[0012]优选地,所述步骤S5中,子网络结构的数据识别模型进行训练以确定所述子网络结构中每个节点处的操作以及操作所涉及的参数的过程中,当所述更新后的训练样本集的规模小于当前训练训练样本集的规模时,使得更新后的模型规模小于前一个模型的规模:包括对前一个模型的参数进行剪枝和参数微调以加快更新后的子网络的训练速度;当所述更新后的训练样本集的规模大于当前训练训练样本集的规模时,使用所述更新后的训练样本集对在所述当前数据识别模型的基础上增加适配尺寸的网络结构后的数据识别模型进行训练,并采用参数复制微调或特征归一化尺度变换以加快训练速度。
[0013]本专利技术具有以下有益效果:本专利技术通过获取网络设备和主机的ID、描述文件、服务接口以及联网对象,并结合输出信号制成网络数据集合作为训练集,用来训练出数据识别模型,在将采集的数据直接输入数据识别模型进行识别,提高了数据识别的速度和精准度。
[0014]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
[0015]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1为本专利技术的一种基于工业互联网的数据识别方法步骤图。
具体实施方式
[0017]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0018]请参阅图1所示,本专利技术为一种基于工业互联网的数据识别方法,包括如下步骤:步骤S1:访问工业互联网的网络设备和主机,获取网络设备和主机的ID、描述文件、服务接口以及联网对象;步骤S2:使用以太网通讯接口采集设备工作过程中的输出信号;步骤S3:将获取到的ID、描述文件、服务接口、联网对象和输出信号进行预处理,制成网络数据集合;步骤S4:将网络数据集合成训练样本集生成数据识别模型的网络结构;步骤S5:基于要识别的数据类型确定要生成的数据识别模型的网络结构参数空间并且从网络结构的参数空间中采样得到具有规模的子网络结构的参数,并根据子网络结构的参数构建用于数据识别模型的网络结构,得到子网络结构的每个结点处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于工业互联网的数据识别方法,其特征在于,包括如下步骤:步骤S1:访问工业互联网的网络设备和主机,获取网络设备和主机的ID、描述文件、服务接口以及联网对象;步骤S2:使用以太网通讯接口采集设备工作过程中的输出信号;步骤S3:将获取到的ID、描述文件、服务接口、联网对象和输出信号进行预处理,制成网络数据集合;步骤S4:将网络数据集合成训练样本集生成数据识别模型的网络结构;步骤S5:基于要识别的数据类型确定要生成的数据识别模型的网络结构参数空间并且从网络结构的参数空间中采样得到具有规模的子网络结构的参数,并根据子网络结构的参数构建用于数据识别模型的网络结构,得到子网络结构的每个结点处的操作;步骤S6:网络数据集合对具有子网络结构的数据识别模型进行训练以确定子网络结构中每个节点处的操作的参数,从而生成数据识别模型。2.根据权利要求1所述的一种基于工业互联网的数据识别方法,其特征在于,所述步骤S1中,所述网络设备和主机的ID为工业互联网中设备的全局唯一标识;所述描述文件为工业互联网中表述设备特性和功能的数字化说明书;所述服务接口为工业互联网中设备与互联网之间进行数据和信息检索、查询、交互的接口;所述联网对象为具有通信能力的目标对象。3.根据权利要求1所述的一种基于工业互联网的数据识别方法,其特征在于,所述步骤S2中,采集设备工程过程中的输出信号的采集装置包括:主控单元和分别与主控单元连接的模拟信号放大单元、开关量信号采集单元、输出单元和通讯单元;所述采集装置通过主控单元内部设置的放大器或通过模拟信号放大单元对外部模拟信号进行放大采集,同时对外部开关量信号进行采集,然后将采集到的外部信号传输给上级设备。4.根据权利要求1所述的一种基于工业互联网的数据识别方法,其特征...

【专利技术属性】
技术研发人员:张永文杨磊季东滨
申请(专利权)人:山东恒远智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1