【技术实现步骤摘要】
一种不确定数据流概率求和阈值查询方法
本专利技术涉及不确定数据流查询处理
,具体涉及一种不确定数据流概率求和阈值查询方法。
技术介绍
随着传感和网络技术的发展,数据流可以被广泛获取。由于设备的固有误差,环境噪声的干扰,通过推理来恢复丢失的信息等,数据流中的数据通常是基于概率的表示。简单地计算这些不确定数据的统计信息(例如:均值和方差)将丢失有用的信息,甚至得出不正确的结论。不确定数据流管理通过采用不确定数据模型来支持概率查询,可以解决这些问题,其中概率求和查询(probabilisticsumquery)是重要的查询类型,该查询以大量的不确定数据(如概率分布函数)为输入,返回概率分布作为结果。在许多监控应用中,只需要知道结果分布是否超过用户定义的阈值。下面给出一个例子。示例1:温度监测。六个传感器同时测量一物体的温度。由于传感器的固有误差和噪声信号的干扰,温度读数会产生误差。使用数据融合技术(如密度估计)将六个传感器的温度读数转换为概率分布。然后,聚合不同时刻的概率分布来检测异常。为此,监视应用程序设计了如下查询:查询:在最近的10分钟内,平均温度超过60度的概率大于80%吗?当查询结果为“true”时,将触发报警。上述查询明确考虑最近10分钟集群整体的负载波动,并将两个阈值引入概率求和查询,一个是概率阈值,另一个是得分阈值。该查询即为不确定数据流概率求和阈值查询,是不确定数据流概率求和查询的扩展。虽然已有大量不确定数据流上概率求和查询的研究工作,这些不确定数据流概率求和 ...
【技术保护点】
1.一种不确定数据流概率求和阈值查询方法,其特征在于,所述方法包括以下步骤:/n(1)将连续不确定数据进行滑动窗口的划分以及对每个窗口内的随机变量进行高斯混合模型建模,即利用高斯分布表示随机变量;/n(2)基于滑动窗口内随机变量之和的第一阶矩和第一阶方差、第二阶矩和第二阶方差对随机变量进行两次过滤判断,在依据第一阶矩和第一阶方差进行第一次过滤判断能够得到获得查询结果时,输出查询结果并返回到步骤(1),在依据第一阶矩和第一阶方差进行第一次过滤判断不能够得到获得查询结果时,依据第二阶矩和第二阶方差进行第二次过滤判断,在能够得到获得查询结果时,输出查询结果并返回到步骤(1),不能够得到获得查询结果时,进入步骤(3);/n(3)将滑动窗口内的随机变量转换为特征函数,基于特征函数进行概率求和,依据求和的概率值与得分阈值和概率阈值的大小关系,判断查询结果为“是”或“否”,并输出查询结果。/n
【技术特征摘要】
1.一种不确定数据流概率求和阈值查询方法,其特征在于,所述方法包括以下步骤:
(1)将连续不确定数据进行滑动窗口的划分以及对每个窗口内的随机变量进行高斯混合模型建模,即利用高斯分布表示随机变量;
(2)基于滑动窗口内随机变量之和的第一阶矩和第一阶方差、第二阶矩和第二阶方差对随机变量进行两次过滤判断,在依据第一阶矩和第一阶方差进行第一次过滤判断能够得到获得查询结果时,输出查询结果并返回到步骤(1),在依据第一阶矩和第一阶方差进行第一次过滤判断不能够得到获得查询结果时,依据第二阶矩和第二阶方差进行第二次过滤判断,在能够得到获得查询结果时,输出查询结果并返回到步骤(1),不能够得到获得查询结果时,进入步骤(3);
(3)将滑动窗口内的随机变量转换为特征函数,基于特征函数进行概率求和,依据求和的概率值与得分阈值和概率阈值的大小关系,判断查询结果为“是”或“否”,并输出查询结果。
2.如权利要求1所述的不确定数据流概率求和阈值查询方法,其特征在于,步骤(1)中,获取不确定数据流中新的第j条不确定数据tj,以最新的w条数据形成滑动窗口其中w∈R+为滑动窗口长度,并以随机变量Xm表示滑动窗口中的第m个元组tj-w+m(1≤m≤w);
采用单变量的高斯混合模型对随机变量Xm进行建模,即用连续型随机变量来表示不确定数据,模型包含k个高斯变量以及对应的非负概率(p1,p2,…,pk)。
随机变量X的概率密度函数为:
其中,μi和σi2为高斯变量的期望和方差,即:
3.如权利要求1所述的不确定数据流概率求和阈值查询方法,其特征在于,步骤(2)具体过程为:
(2-1)根据随机变量的期望和方差计算滑动窗口内所有随机变量之和的第一阶矩、第二阶矩、第一阶方差和第二阶方差;
(2-2)根据滑动窗口内所有随机变量之和的第一阶矩和第一阶方差与得分阈值和概率阈值的大小关系进行第一次过滤判断查询结果;
(2-3)在不能输出查询结果时,根据滑动窗口内所有随机变量之和的第二阶矩和第二阶方差与得分阈值和概率阈值的大小关系进行第二次过滤判断查询结果。
4.如权利要求3所述的不确定数据流概率求和阈值查询方法,其特征在于,步骤(2-1)具体包括以下步骤:
(2-1-1)计算随机变量Xm的期望E(X)和方差Var(X);
具体地,根据高斯分布的期望和方差计算期望E(X),具体公式如下:
(2-1-2)计算滑动窗口内所有随机变量之和的第一阶矩E(Y)和第二阶矩E(Y2);
具体地,根据期望E(Xm)和方差Var(Xm)计算滑动窗口内所有随机变量之和Y的第一阶矩E(Y)和第二阶矩E(Y2),具体公式如下:
(2-1-3)计算滑动窗口内所有随机变量之和Y的方差Var(Y);
具体地,根据第一阶矩E(Y)和第二阶矩E(Y2)计算滑动窗口内所有随机变量之和Y的方差Var(Y),具体公式如下:
Var(Y)=E(Y2)-(E(Y))2
(2-1-4)计算滑动窗口内所有随机变量之和Y的第四阶矩E(Y4)和第二阶方差Var(Y2);
具体地,根据第一阶矩E(Y)、第二阶矩E(Y2)以及第一阶方差Var(Y)计算滑动窗口内所有随机变量之和Y的第四阶矩E(Y4)和第二阶方差Var(Y2),具体公式如下:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。