System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据质量增强方法、系统、设备和存储介质技术方案_技高网

一种数据质量增强方法、系统、设备和存储介质技术方案

技术编号:43285034 阅读:11 留言:0更新日期:2024-11-12 16:07
本发明专利技术涉及数据增强技术领域,尤其涉及一种数据质量增强方法、系统、设备和存储介质,方法包括:采集感知平台的样本数据,将样本数据通过聚类算法按照距离分为若干个簇,将样本点稀少的簇定义为感知薄弱区域,且划分若干网格;将样本数据纳入网格中,根据一个网格中的样本数据的数量对网格进行赋值;将网格的赋值输入RBM网络中,对样本数据进行特征映射,获取数据特征并利用时空关联实现数据质量的增强;其中,在时间维度上,相邻时间段数据存在相关性;利用同一个网格采样数据的时间相关性预测下一时刻的数据特征,并利用双向估计预测残差重构,修正本时刻的数据特征;采用解码器恢复本时刻的数据,实现不同网格数据质量的优化。

【技术实现步骤摘要】

本专利技术涉及数据增强,尤其涉及一种数据质量增强方法、系统、设备和存储介质


技术介绍

1、群智协同感知来源于“众包”思想,以“参与式”感知通过群体间有意识或者无意识的方式协同完成任务,群智协同感知网络则为群智协同感知提供信息交互和计算的工具,其通过“人和移动设备”相结合,采用人机混合感知的方式实现整个城市范围内的实时感知和计算,从而能够在短时间内完成大规模、复杂的感知任务,群智协同感知网络应用于多个领域,包括环境监测、智能交通、公共安全、社交推荐、城市规划、网络优化、医疗健康等等。然而,群智协同感知严重依赖用户移动能力和数据质量,用户的移动能力决定了数据采集的均衡性,数据质量决定了群智协同感知模型的可靠性。


技术实现思路

1、本专利技术提供一种数据质量增强方法、系统、设备和存储介质,通过感知平台识别感知薄弱区域,然后借助rbm实现网格化数据和特征之间的映射,最后借助多假设预测残差重构算法实现网格数据特征修正并利用rbm反向解码器恢复本时刻网格数据。建立非均匀采样数据间的数据结构映射关系和数据恢复残差重构方法,实现融合用户位置信息的数据结构特征提取、数据映射以及数据恢复,通过数据结构映射优化感知薄弱区数据内容的推测结果,增强群智感知网络的数据质量。

2、本专利技术提供了一种数据质量增强方法,包括:

3、采集感知平台的样本数据,将样本数据通过聚类算法按照距离分为若干个簇,将样本点稀少的簇定义为感知薄弱区域,且划分若干网格;将样本数据纳入网格中,根据一个网格中的样本数据的数量对网格进行赋值;

4、将网格的赋值输入rbm网络中,对样本数据进行特征映射,获取数据特征并利用时空关联实现数据质量的增强;其中,在时间维度上,相邻时间段数据存在相关性;

5、利用同一个网格采样数据的时间相关性预测下一时刻的数据特征,并利用双向估计预测残差重构,修正本时刻的数据特征;采用解码器恢复本时刻的数据,实现不同网格数据质量的优化。

6、优选的,所述样本信息包括经纬度信息。

7、优选的,在采集感知平台的样本数据,将样本数据通过聚类算法按照距离分为若干个簇,将样本点稀少的簇定义为感知薄弱区域,且划分若干网格;将样本数据纳入网格中,根据一个网格中的样本数据的数量对网格进行赋值中:

8、所述将样本数据通过聚类算法按照距离分为若干个簇包括:

9、基于经纬度信息,采用k-means聚类算法按照样本数据之间距离大小将样本划分为k个簇;具体为:

10、

11、e值越小则簇内样本数据相似度越高;其中,ci表示第i个簇,ui表示第i个簇的中心点,x表示经纬度信息;

12、所述将样本点稀少的簇定义为感知薄弱区域,且划分若干网格;将样本数据纳入网格中,根据一个网格中的样本数据的数量对网格进行赋值包括:

13、将样本点稀少的簇定义为感知薄弱区域,并将该区域的位置划分10×10的网格,并按照经纬度信息将样本数据纳入网格中;如果一个网格中有多个样本数据,将样本数据进行均值处理并对该网格赋值;如果该网格缺失样本数据,则该网格的数据值为0。

14、优选的,所述将网格的赋值输入rbm网络中,对样本数据进行特征映射,获取数据特征并利用时空关联实现数据质量的增强包括:

15、采用rbm网络实现采样数据特征提取,rbm共有l层,自底向上,层节点到层节点的权重矩阵分别为:w0,w1,...,wl-2,偏置分别为:b1,b2,...,bl;

16、输入网格赋值为:

17、a0=(a1,a2,...,at)

18、则第二层的第j个神经元的输出为:

19、

20、将第二层神经元的所有输出作为输入再计算下一层神经元的输出,以此类推;则第l层的第j个神经元的输出为:

21、

22、其中ai为l-1层i个神经元的输出,即为p(h(l-1)i=1),共有l层,则最后一层第j个神经元的输出为:

23、

24、其中,ai=p(h(l-1)i=1),那第l层的特征可表示为:

25、zt=[p(hl1=1),...,p(hlj=1),...,p(hlm=1)]。

26、优选的,所述利用同一个网格采样数据的时间相关性预测下一时刻的数据特征,并利用双向估计预测残差重构,修正本时刻的数据特征;采用解码器恢复本时刻的数据,实现不同网格数据质量的优化包括:

27、在获取数据特征的基础上,利用同一个网格采样数据的时间相关性实现多假设预测下一时刻的数据特征,并利用双向估计实现多假设预测残差重构,修正该时刻的数据特征;设本时刻为t,结合前一时刻数据特征zt-1和后一时刻数据特征zt+1对当前时刻数据特征进行多假设预测,t时刻多假设预测特征为:

28、

29、基于时间序列采用双向估计对预测值的误差进一步修正,具体为:

30、

31、et表示第t时刻的预测误差;结合rbm获取的数据特征和残差重构t时刻的数据特征表示为:

32、

33、获得t时刻的数据特征后,采用解码器恢复t时刻的数据,在rbm的可视层和隐藏层之间进行反向传递,实现不同网格数据质量的优化。

34、优选的,一种数据质量增强系统,包括

35、数据采集模块,用于采集感知平台的样本数据,将样本数据通过聚类算法按照距离分为若干个簇,将样本点稀少的簇定义为感知薄弱区域,且划分若干网格;将样本数据纳入网格中,根据一个网格中的样本数据的数量对网格进行赋值;

36、数据映射模块,用于将网格的赋值输入rbm网络中,对样本数据进行特征映射,获取数据特征并利用时空关联实现数据质量的增强;其中,在时间维度上,相邻时间段数据存在相关性;

37、数据重构模块,用于利用同一个网格采样数据的时间相关性预测下一时刻的数据特征,并利用双向估计预测残差重构,修正本时刻的数据特征;采用解码器恢复本时刻的数据,实现不同网格数据质量的优化。

38、优选的,一种设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现所述的一种数据质量增强方法。

39、优选的,一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行所述的一种数据质量增强方法。

40、与现有技术相比,本专利技术的有益效果为:

41、本专利技术公开了一种数据质量增强方法、系统、设备和存储介质,通过感知平台识别感知薄弱区域,然后借助rbm实现网格化数据和特征之间的映射,最后借助多假设预测残差重构算法实现网格数据特征修正并利用rbm反向解码器恢复本时刻网格数据。建立非均匀采样数据间的数据结构映射关系和数据恢复残差重构方法,实现融合用户位置信息的数据结构特本文档来自技高网...

【技术保护点】

1.一种数据质量增强方法,其特征在于,包括:

2.根据权利要求1所述的一种数据质量增强方法,其特征在于,在采集感知平台的样本数据,将样本数据通过聚类算法按照距离分为若干个簇,将样本点稀少的簇定义为感知薄弱区域,且划分若干网格;将样本数据纳入网格中,根据一个网格中的样本数据的数量对网格进行赋值中:

3.根据权利要求2所述的一种数据质量增强方法,其特征在于,所述样本数据包括经纬度信息。

4.根据权利要求2所述的一种数据质量增强方法,其特征在于,所述将网格的赋值输入RBM网络中,对样本数据进行特征映射,获取数据特征并利用时空关联实现数据质量的增强包括:

5.根据权利要求4所述的一种数据质量增强方法,其特征在于,所述利用同一个网格采样数据的时间相关性预测下一时刻的数据特征,并利用双向估计预测残差重构,修正本时刻的数据特征;采用解码器恢复本时刻的数据,实现不同网格数据质量的优化包括:

6.一种数据质量增强系统,其特征在于,包括

7.一种设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的一种数据质量增强方法。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任一项所述的一种数据质量增强方法。

...

【技术特征摘要】

1.一种数据质量增强方法,其特征在于,包括:

2.根据权利要求1所述的一种数据质量增强方法,其特征在于,在采集感知平台的样本数据,将样本数据通过聚类算法按照距离分为若干个簇,将样本点稀少的簇定义为感知薄弱区域,且划分若干网格;将样本数据纳入网格中,根据一个网格中的样本数据的数量对网格进行赋值中:

3.根据权利要求2所述的一种数据质量增强方法,其特征在于,所述样本数据包括经纬度信息。

4.根据权利要求2所述的一种数据质量增强方法,其特征在于,所述将网格的赋值输入rbm网络中,对样本数据进行特征映射,获取数据特征并利用时空关联实现数据质量的增强包括:

5.根据权利要求4所述的一种数据质量增强方法,其特征在...

【专利技术属性】
技术研发人员:付珍杜翠凤陈少权曾军米红伟
申请(专利权)人:中电科普天科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1