数据监测方法及装置制造方法及图纸

技术编号:39165070 阅读:19 留言:0更新日期:2023-10-23 15:04
本说明书一个或多个实施例提供了一种数据监测方法及装置。通过该方法,可以获取至少两条样本数据,作为与待识别数据的相似度判断的样本。然后,可以根据时间规整算法计算待识别数据与每条样本数据之间的距离,得到第一距离序列;还可以计算每两条样本数据之间的距离,得到第二距离序列。之后,可以根据T检验算法对第一距离序列和第二距离序列进行检验,并且,根据检验结果判断待识别数据和样本数据是否相似。在应用于不同的场景时,该待识别数据和样本数据包括但不限于图像数据、文字数据或语音数据。语音数据。语音数据。

【技术实现步骤摘要】
数据监测方法及装置


[0001]本说明书一个或多个实施例涉及数据处理
,尤其涉及一种数据监测方法及装置。

技术介绍

[0002]随着计算机及互联网技术的发展,生产和生活活动的数字化程度越来越高,短时间内可以产生大量数据,而这些数据中往往存在很多完全相同或相似程度很高的数据。例如,告警监测系统在监测系统或设备的运行情况时,会对运行过程中的异常或故障生成告警信息,以提示相关人员进行故障排除;但在异常或故障排除前,该告警信息可能会每间隔一段时间就重复生成一次,从而产生大量的重复告警信息,使得相关人员工作任务加重。
[0003]因此,需要提供一种数据监测方法,以有效识别系统或设备中产生的相同或相似数据,提高系统作业效率,提升相关人员的体验。

技术实现思路

[0004]为了有效识别系统或设备中产生的相同或相似数据,提高系统作业效率,提升相关人员的体验,本说明书一个或多个实施例提供了一种数据监测方法及装置。
[0005]第一方面,本说明书一个或多个实施例提供了一种数据监测方法,该方法包括:
[0006]获取待识别数据和至少两条样本数据;
[0007]根据时间规整算法计算得到第一距离序列和第二距离序列;其中,所述第一距离序列为所述待识别数据和每条所述样本数据之间的距离,所述第二距离序列为所述至少两条样本数据两两之间的距离;
[0008]根据T检验算法对所述第一距离序列和第二距离序列进行检验,得到检验结果;
[0009]根据所述检验结果判断所述待识别数据和所述样本数据是否相似。
[0010]一种可能的实现方式中,所述获取待识别数据和至少两条样本数据,包括:
[0011]获取所述待识别数据,并根据所述待识别数据,按照预设筛选规则,筛选得到至少两条历史数据,作为所述样本数据。
[0012]一种可能的实现方式中,所述获取待识别数据和至少两条样本数据,包括:
[0013]获取所述待识别数据,并根据所述待识别数据,按照预设筛选规则,筛选得到历史数据;
[0014]按照预设移动规则,将所述历史数据进行移动,将移动前后的历史数据作为所述样本数据。
[0015]一种可能的实现方式中,所述预设移动规则包括以下至少一项:预设移动次数n、预设单次移动幅度

t、预设移动方向;
[0016]其中,所述预设移动方向包括以下至少一项:朝向所述历史数据的起点的第一方向、朝向所述历史数据的终点的第二方向;
[0017]所述按照预设移动规则,将所述历史数据进行移动,包括以下至少一项:
[0018]按照所述第一方向和所述预设单次移动幅度

t,将所述历史数据移动n次,得到n个第一样本数据;
[0019]按照所述第二方向和所述预设单次移动幅度

t,将所述历史数据移动n次,得到n个第二样本数据。
[0020]一种可能的实现方式中,在所述根据时间规整算法计算得到第一距离序列和第二距离序列之前,所述方法还包括:对所述待识别数据和所述样本数据进行归一化处理;或者,对所述待识别数据和所述样本数据进行去中值化处理。
[0021]一种可能的实现方式中,所述根据T检验算法对所述第一距离序列和第二距离序列进行检验,得到检验结果,包括:
[0022]根据所述T检验算法对所述第一距离序列和所述第二距离序列进行检验,得到所述T检验算法的原假设的置信度水平;
[0023]所述根据所述检验结果判断所述待识别数据和所述样本数据是否相似,包括:
[0024]若所述置信度水平为所述原假设的置信度大于预设阈值,判定所述待识别数据和所述样本数据相似。
[0025]一种可能的实现方式中,所述原假设包括:所述第一距离序列的第一距离均值和所述第二距离序列的第二距离均值相等。
[0026]一种可能的实现方式中,在所述根据所述T检验算法对所述第一距离序列和所述第二距离序列进行检验之前,所述方法还包括:检验所述第一距离序列和所述第二距离序列的方差齐性,并在所述第一距离序列和所述第二距离序列满足方差齐性时,执行所述根据所述T检验算法对所述第一距离序列和所述第二距离序列进行检验。
[0027]一种可能的实现方式中,所述还包括以下至少一项:
[0028]在所述待识别数据和所述样本数据相似时,将所述待识别数据与所述样本数据合并;
[0029]在所述待识别数据和所述样本数据不相似时,将所述待识别数据发送至数据需求端;
[0030]将所述待识别数据和所述样本数据的相似性判断结果发送至所述数据需求端;
[0031]将所述待识别数据和所述样本数据的相似性判断结果存储至预设样本数据库。
[0032]一种可能的实现方式中,所述待识别数据包括:待识别告警数据;所述样本数据包括:历史告警数据。
[0033]第二方面,本说明书一个或多个实施例还提供了一种数据监测装置,该装置包括:
[0034]数据获取模块,用于获取待识别数据和至少两条样本数据;
[0035]距离计算模块,用于根据时间规整算法计算得到第一距离序列和第二距离序列;其中,所述第一距离序列为所述待识别数据和每条所述样本数据之间的距离,所述第二距离序列为所述至少两条样本数据两两之间的距离;
[0036]T检验模块,用于根据T检验算法对所述第一距离序列和第二距离序列进行检验,得到检验结果;
[0037]相似判断模块,用于根据所述检验结果判断所述待识别数据和所述样本数据是否相似。
[0038]一种可能的实现方式中,所述数据获取模块包括:
[0039]第一获取模块,用于获取所述待识别数据,并根据所述待识别数据,按照预设筛选规则,筛选得到至少两条历史数据,作为所述样本数据。
[0040]一种可能的实现方式中,所述数据获取模块包括:
[0041]第二获取模块,用于获取所述待识别数据,并根据所述待识别数据,按照预设筛选规则,筛选得到历史数据,并按照预设移动规则,将所述历史数据进行移动,将移动前后的历史数据作为所述样本数据。
[0042]一种可能的实现方式中,所述预设移动规则包括以下至少一项:预设移动次数n、预设单次移动幅度

t、预设移动方向;
[0043]其中,所述预设移动方向包括以下至少一项:朝向所述历史数据的起点的第一方向、朝向所述历史数据的终点的第二方向;
[0044]所述第二获取模块用于按照预设移动规则,将所述历史数据进行移动,将移动前后的历史数据作为所述样本数据,包括以下至少一项:
[0045]所述第二获取模块用于按照所述第一方向和所述预设单次移动幅度

t,将所述历史数据移动n次,得到n个第一样本数据;
[0046]所述第二获取模块用于按照所述第二方向和所述预设单次移动幅度

t,将所述历史数据移动n次,得到n个第二样本数据。
[0047]一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据监测方法,其特征在于,所述方法包括:获取待识别数据和至少两条样本数据;根据时间规整算法计算得到第一距离序列和第二距离序列;其中,所述第一距离序列为所述待识别数据和每条所述样本数据之间的距离,所述第二距离序列为所述至少两条样本数据两两之间的距离;根据T检验算法对所述第一距离序列和第二距离序列进行检验,得到检验结果;根据所述检验结果判断所述待识别数据和所述样本数据是否相似。2.如权利要求1所述的方法,其特征在于,所述获取待识别数据和至少两条样本数据,包括:获取所述待识别数据,并根据所述待识别数据,按照预设筛选规则,筛选得到至少两条历史数据,作为所述样本数据。3.如权利要求1所述的方法,其特征在于,所述获取待识别数据和至少两条样本数据,包括:获取所述待识别数据,并根据所述待识别数据,按照预设筛选规则,筛选得到历史数据;按照预设移动规则,将所述历史数据进行移动,将移动前后的历史数据作为所述样本数据。4.如权利要求3所述的方法,其特征在于,所述预设移动规则包括以下至少一项:预设移动次数n、预设单次移动幅度

t、预设移动方向;其中,所述预设移动方向包括以下至少一项:朝向所述历史数据的起点的第一方向、朝向所述历史数据的终点的第二方向;所述按照预设移动规则,将所述历史数据进行移动,包括以下至少一项:按照所述第一方向和所述预设单次移动幅度

t,将所述历史数据移动n次,得到n个第一样本数据;按照所述第二方向和所述预设单次移动幅度

t,将所述历史数据移动n次,得到n个第二样本数据。5.如权利要求1所述的方法,其特征在于,在所述根据时间规整算法计算得到第一距离序列和第二距离序列之前,所述方法还包括:对所述待识别数据和所述样本数据进行归一化处理;或者,对所述待识别数据和所述样本数据进行去中值化处理。6.如权利要求1所述的方法,其特征在于,所述根据T检验算法对所述第一距离序列和第二距离序列进行检验,得到检验结果,包括:根据所述T检验算法对所述第一距离序列和所述第二距离序列进行检验,得到所述T检验算法的原假设的置信度水平;所述根据所述检验结果判断所述待识别数据和所述样本数据是否相似,包括:若所述置信度水平为所述原假设的置信度大于预设阈值,判定所述待识别数据和所述样本数据相似。7.如权利要求6所述的方法,其特征在于,所述原假设包括:所述第一距离序列的第一距离均值和所述第二距离序列的第二距离均值相等。
8.如权利要求1所述的方法,其特征在于,在所述根据所述T检验算法对所述第一距离序列和所述第二距离序列进行检验之前,所述方法还包括:检验所述第一距离序列和所述第二距离序列的方差齐性,并在所述第一距离序列和所述第二距离序列满足方差齐性时,执行所述根据所述T检验算法对所述第一距离序列和所述第二距离序列进行检验。9.如权利要求1所述的方法,其特征在于,所述方法还包括以下至少一项:在所述待识别数据和所述样本数据相似时,将所述待识别数据与所述样本数据合并;在所述待识别数据和所述样本数据不相似时,将所述待识别数据发送至数据需求端;将所述待识别数据和所述样本数据的相似性判断结果发送至所述数据需求端;将所述待识别数据和所述样本数据的相似性判断结果存储至预设样本数据库。10.如权利要求1所述的方法,其特征在于,所述待识别数据包括:待识别告警数据;所述样本数据包括:历史告警数据。11.一种数据监测装置,其特征在于,所述装置包括:数据获取模块,用于获取待识别数据和至少两条样本数据;距离计算模块,用于根据时间规整算法计算得到第一距离序列和第二距离序列;其中,所述第一距离序列为所述待识别数据和每条所述样本数据之间的距离,所述第二距离序列为所述至少两条样本数据两两之间的距离;T检验模块,用于根据T检验算法对所述第一距离序列和第二距离序列进行检验,得到检验结果;相似判断模块,用于根据所述检验结果判断所述待识别数据和所述样本数据是否相似。12.如权利要...

【专利技术属性】
技术研发人员:易冬泉
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1