一种自主分类辨识及剔除伪数据的智能数源采集方法技术

技术编号:38208745 阅读:6 留言:0更新日期:2023-07-21 16:58
本发明专利技术涉及一种自主分类辨识及剔除伪数据的智能数源采集方法,属于传感技术领域。该方法包括:采用检测元件的电信号时、频域特征值提取方法,得到时域特征f(t

【技术实现步骤摘要】
一种自主分类辨识及剔除伪数据的智能数源采集方法


[0001]本专利技术属于传感
,涉及一种自主分类辨识及剔除伪数据的智能数源采集方法。

技术介绍

[0002]目前传感器的智能化功能主要集中在人机交互方面,以利于使用者更加便捷的使用传感设备。如:一种无线智能传感器及该传感器即插即用的实现方法、基于信物模型的智能传感器自适应配置方法、装置及系统等。都是基于传感数据可信的基础上去丰富传感器的应用场景,而忽视了智能传感器设备的自身检测结果的有效性。
[0003]基于此,本专利技术综合利用传感设备的空间环境及自身状态多维复合融合感知方法,获取传感设备的健康度,将感知数据与经验数据训练模型比对,自主识别、剔除智能传感设备的敏感元件检测数据中的伪数据,使智能传感器的能自主智能判断自身的传感数据有效性。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种自主分类辨识及剔除伪数据的智能数源采集方法。本专利技术针对数源采集设备的检测参量因外界某些因素导致参量时、频域出现超出常规的参量特征,输出不可信的数源采集数据,即伪数据。这些伪数据形成主要是因为数源采集设备的空间环境及自身状态异常引起,因此通过采用多维复合交叉感知方法,获取数源采集设备的健康度,分析评估数源采集设备健康度与数源采集数据关联比重因子,剔除因自身状态缺陷导致的伪数据,输出数源采集设备的感知结果,提升数源采集设备现场工作稳定性和智能化水平。
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]采用检测元件的弱电数源时、频域特征值提取方法,得到时域特征f(t

)=f(t

+mT)
[0007](m=0,
±
1,
±
2,
……
),以及频域特征F(ω

)=F|f(t

)|。经验数据训练参量模型L(ω,t)是由数源采集设备在常规条件下参量分类器关于时间(t)和频率(ω)变量的特征分类器函数。将数源采集器元件的实时数据的时域和频域数源值输入参量分类器提取函数L(ω

,t

),与经验数据训练参量分类器模型L(ω,t)比对,比对方法采用比值法,设定伪数据(即非常规数据或异常数据)容忍度为δ,如果L(ω

,t

)/L(ω,t)≤1

δ或者L(ω

,t

)/L(ω,t)≥1+δ,则认定当前数据为伪数据,分类辨识并剔除智能数源采集设备的敏感元件检测数据中检测数源不符合时域频域参量分类器L(ω,t)的伪数据;
[0008]数源采集设备所处环境的改变对设备产生较大影响,采用数源采集设备的空间环境及自身状态多维复合交叉感知方法,获取多源、多维(温度T、湿度H、加速度A、时间t、安装位置P、感知元件健康度S、设备电源健康度e等感知物理量)实时参量,形成环境参量常态条件下的数据参量分类器E(T,H,A,t,P,S,e),每种物理量分配比例权重δ1,δ2,δ3
……
δn,比
例权重经验库关联公式计算,比例权重与严酷等级根据预设的分段函数设置,设定范围为0~1,不同种类数源采集器设备的关联分类器不同。物理量的比例权重为0时,数源采集器设备的健康度为0;只有所有参量模型物理量的所有物理量为1时,数源采集器健康度为1。若数源采集器健康度为0,则判定该时间点的数据是因自身状态缺陷导致的伪数据,予以剔除;若数源采集器健康度不为0,输出智能数源采集设备的附带感知数据可信度的感知结果。
[0009]数源采集设备根据以上两种分类辨识结果,分类辨识及剔除伪数据并输出智能数源采集设备的感知结果。
[0010]本专利技术的有益效果在于:本专利技术重点关注了智能传感器设备的检测数据的可信度,提高智能传感系统设备的感知准确性。
[0011]本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0012]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作优选的详细描述,其中:
[0013]图1为本专利技术流程图;
[0014]图2为信号时域频域分析流程框图;
[0015]图3为多维感知数据分析流程框图。
具体实施方式
[0016]请参阅图1、图2和图3,为一种自主分类辨识及剔除伪数据的智能数源采集方法。
[0017]传感器在t

时刻,检测到时域信号f(t

),将f(t

)采用离散傅里叶变换、或者小波变换等频域处理方法,转换为频域信号F(ω

),计算该时间段的频谱特征频率值ω

,以及频谱能量值W

,得到检测信号此时刻的时域+频域提取函数L(ω

,t

),与经验数据训练模型L(ω,t)比对,比对方法采用比值法,设定伪数据(即非常规数据或异常数据)容忍度为δ(例如设定0.1<δ<0.5),如果ω

/ω≤1

δ或者ω

/ω≥1+δ,则认定当前数据数据时域变化频率超出经验数据特征,判定为伪数据;如果W

/W≤1

δ或者W

/W≥1+δ,则认定数据信号频域变化幅度大于超出经验数据特征,判定为伪数据;从而识别并剔除智能传感设备的敏感元件检测数据中检测信号不符合时域频域模型L(ω,t)的伪数据;
[0018]传感设备所处环境的改变对设备产生较大影响,采用传感设备的空间环境及自身状态多维复合融合感知方法,获取多源、多维(温度T、湿度H、加速度A、时间t、安装位置P、感知元件健康度S、设备电源健康度e等感知物理量)实时数据,形成环境参量常态条件下的数据模型E(T,H,A,t,P,S,e),每种物理量分配比例权重δ1,δ2,δ3
……
δn,比例权重经验库关联公式计算,比例权重与严酷等级根据预设的分段函数设置,设定范围为0~1,不同种类传感器设备的关联函数不同。
[0019]假定当前采煤工作面一台甲烷传感器出现一帧0.8%CH4的检测数据,环境数据为
温度15℃、相对湿度90%RH、加速度为9.8g、时间19:00、安装位置采煤工作面、感知元件健康度0.6、设备电源健康度为1。根据多维感知数据分析流程图及设定的物理量权重参数,获得温度δ1=1,湿度δ2=0.5,加速度δ3=0,时间δ4=1,安装位置δ5=0.9,元件健康度δ6=0.6,电源健康度δ7=1。计算设备综合健康度δ=0.7。因此因当前环本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自主分类辨识及剔除伪数据的智能数源采集方法,其特征在于:该方法包括:采用检测元件的电信号时、频域特征值提取方法,得到时域特征f(t

)=f(t

+mT),m=0,
±
1,
±
2,
……
,以及频域特征F(ω

)=F|f(t

)|;经验数据训练模型L(ω,t)是由传感设备在常规条件下数据集关于时间(t)和频率(ω)变量的特征提取函数;将传感器元件的实时数据的时域和频域信号值输入模型提取函数L(ω

,t

),与经验数据训练模型L(ω,t)比对,比对方法采用比值法,设定伪数据容忍度为δ,如果L(ω

,t

)/L(ω,t)≤1

δ或者L(ω

,t

)/L(ω,t)≥1+δ,则认定当前数据为伪数据,识别并剔除智能传感设备的敏感元件检测数据中检测信号不符...

【专利技术属性】
技术研发人员:梁光清孙世岭赵庆川于庆张远征郭清华王尧李涛槐利马勤勇周德胜邓杰薛宗杰刘芬黄海峰
申请(专利权)人:中煤科工集团重庆研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1