基于大数据的风险预测系统及其预测方法技术方案

技术编号:36436687 阅读:13 留言:0更新日期:2023-01-20 22:50
本申请涉及风险预测的领域,其具体地公开了一种基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。害。害。

【技术实现步骤摘要】
基于大数据的风险预测系统及其预测方法


[0001]本申请涉及风险预测的领域,且更为具体地,涉及一种基于大数据的风险预测系统及其预测方法。

技术介绍

[0002]地球地质环境的变化导致滑坡的发生,人类对地质结构影响使得滑坡发生频率增大,给社会、国家和个人带来严重的危害。滑坡是一种普遍的全球性的自然地质灾害,给人类的生命财产安全带来了严重危害。
[0003]滑坡地质灾害发生频繁造成的危害严重,归结其原因在于滑坡发生具有很强的隐蔽性和突发性,导致人们不易察觉,从而造成严重的影响。如何有效地进行预测预警监测滑坡,减少其带来的危害,是亟需解决的技术问题。
[0004]因此,期望一种基于大数据的风险预测系统以对山体滑坡灾害进行准确地预测,进而减小其带来的危害。

技术实现思路

[0005]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
[0006]根据本申请的一个方面,提供了一种基于大数据的风险预测系统,其包括:
[0007]训练模块,包括:
[0008]训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
[0009]特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
[0010]高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的
特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
[0011]高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;
[0012]高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;
[0013]分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;
[0014]系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;
[0015]训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及
[0016]推断模块,包括:
[0017]原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
[0018]特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
[0019]高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
[0020]高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;
[0021]分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及
[0022]分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
[0023]与现有技术相比,本申请提供的基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来
平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
附图说明
[0024]通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0025]图1为根据本申请实施例的基于大数据的风险预测系统的场景示意图。
[0026]图2为根据本申请实施例的基于大数据的风险预测系统的框图。
[0027]图3A为根据本申请实施例的基于大数据的风险预测系统的预测方法中训练阶段的流程图。
[0028]图3B为根据本申请实施例的基于大数据的风险预测系统的预测方法中推断阶段的流程图。
[0029]图4为根据本申请实施例的基于大数据的风险预测系统的预测方法中训练阶段的架构示意图。
[0030]图5为根据本申请实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的风险预测系统,其特征在于,包括:训练模块,包括:训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及推断模块,包括:原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度
特征向量中各个位置的特征值间的方差构成;高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。2.根据权利要求1所述的基于大数据的风险预测系统,其中,所述特征编码单元,进一步用于使用所述编码器模型的嵌入层分别将各个所述角度数据、各个所述阻抗数据、各个所述位移数据和各个所述温度数据转化为角度输入向量、阻抗输入向量、位移输入向量和温度输入向量以获得角度输入向量的序列、阻抗输入向量的序列、位移输入向量的序列和温度输入向量的序列;以及,使用所述编码器模型的转换器从所述角度输入向量的序列、所述阻抗输入向量的序列、所述位移输入向量的序列和所述温度输入向量的序列获得所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量。3.根据权利要求2所述的基于大数据的风险预测系统,其中,所述高斯融合单元,用于使用高斯密度图以如下公式来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图;其中,所述公式为其中,μ
i
为所述第一至第四高斯密度图的均值向量,且∑
i
是所述第一至第四高斯密度图的协方差矩阵。4.根据权利要求3所述的基于大数据的风险预测系统,其中,所述高斯混合单元,进一步用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图以如下公式来构造所述高斯混合模型;其中,所述公式为:所述高斯混合模型的均值向量为μ1到μ4乘以系数后进行点加,且所述高斯混合模型的协方差矩阵为∑1到∑4乘以系数后进行点加。5.根据权利要求4所述的基于大数据的风险预测系统,其中,所述分类损失函数值计算单元,进一步用于使用所述分类器以如下公式对所述分类矩阵进行处理以获得分类结果;其中,所述公式为:softmax{(W
n
,B
n
):

:(W1,B1)|Project(F)},其中Project(F)表示将所述分类矩阵投影为向量,W1至W
n
为各层全连接层的权重矩阵,B...

【专利技术属性】
技术研发人员:刘笑颖
申请(专利权)人:杭州邬萍科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1