【技术实现步骤摘要】
工业互联网多模态机器学习数据处理方法
[0001]本专利技术涉及工业互联网
,特别是涉及工业互联网多模态机器学习数据处理方法。
技术介绍
[0002]现有技术中,工业互联网场景下引入大量终端后,收集的数据会来自于不同数据源,例如要建立电网中变电站运作是否正常的机器模型,会收集不同时间的温度,湿度,变压器油分离后特定气体的含量,可见光数据(视频,图像),红外热力图类别数据(通过热成像传感仪拍摄的数据),声音,气味等,在数据源众多时,利用多个数据源建立多模态机器学习模型是一个已有的方法来利用相关数据集合。但是,如何衡量每个数据源在模型中的价值在现有技术中没有过多的研究,不利于针对不同场景选择不同的多个数据源,造成系统成本高。
技术实现思路
[0003]本专利技术所要解决的技术问题是如何衡量每个数据源在模型中的价值在现有技术中没有过多的研究。
[0004]为解决上述技术问题,本专利技术采用的一个技术方案是:提供工业互联网多模态机器学习数据处理方法,包括如下具体方法:
[0005]步骤一.计算所有多模态数据集合之间两两的相关性,首先需要清理数据,使得数据在时间上对齐,判断两个数据集合是否相关:
[0006]否:判断所有数据是否处理完毕;
[0007]是:挑选合适的数据集合作为建模数据,并判断所有数据是否处理完毕;
[0008]步骤二.所有数据未处理完毕,则通过步骤一重新开始,若所有数据处理完毕,则建立合适的多模态机器学习模型。
[0009]优选的,所述步骤 ...
【技术保护点】
【技术特征摘要】
1.工业互联网多模态机器学习数据处理方法,其特征在于,包括如下具体方法:步骤一.计算所有多模态数据集合之间两两的相关性,首先需要清理数据,使得数据在时间上对齐,判断两个数据集合是否相关:否:判断所有数据是否处理完毕;是:挑选合适的数据集合作为建模数据,并判断所有数据是否处理完毕;步骤二.所有数据未处理完毕,则通过步骤一重新开始,若所有数据处理完毕,则建立合适的多模态机器学习模型。2.根据权利要求1所述的工业互联网多模态机器学习数据处理方法,其特征在于,所述步骤一中需要清理数据,使得数据在时间上对齐的方法如下:针对所有数据在时间上对齐,设定同一段时间内固定的时间间隔,在每个时间点上取所有的数据作为清理输出,如果该时间点上某个数据源没有数据,需要通过前后数据计算获得采样。3.根据权利要求2所述的工业互联网多模态机器学习数据处理方法,其特征在于,获得采样的具体方法如下:设横轴是时间轴,X是需要计算的采样时间点,前后数据是(x0,y0),(x1,y1),采样点y值计算公式为:4.根据权利要求1所述的工业互联网多模态机器学习数据处理方法,其特征在于,所述相关性的计算方法如下:相关性有两种表达方法,一种是协方差,一种是相关系数,相关系数可以看成是标准化后的协方差,设:X
t
为第一组经过清理的数据,Y
t
为第二组经过清理的数据,μ
x
为X
t
的均值,μ
y
为Y
t
的均值,σ
x
为X
t
的标准差,σ
y
为Y
t
的标准差,E[
·
]为计算期望,所述X
t
和Y
t
的协方差为Cov...
【专利技术属性】
技术研发人员:吴斌,王雪峰,刘青,
申请(专利权)人:南京英锐祺科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。