基于掩码的频谱预测解释方法及系统技术方案

技术编号:35064594 阅读:33 留言:0更新日期:2022-09-28 11:21
本发明专利技术公开了一种基于掩码的频谱预测解释方法及系统,属于通信技术领域。所述方法包括利用频谱数据集训练黑箱模型;将待解释频谱序列输入训练好的黑箱模型,得到第一预测值;根据待解释频谱序列和初始掩码矩阵,利用有意义扰动机制得到扰动矩阵;将扰动矩阵输入训练好的黑箱模型,并以所述第一预测值作为基准值,利用基于掩码方案的损失函数进行优化,输出新的掩码矩阵;根据所述新的掩码矩阵,利用显著图进行可视化解释。所述系统是根据所述的方法对频谱预测进行解释。本发明专利技术克服了频谱序列预测问题中深度学习技术可解释性不足,解释效果直观且时间相关性得以体现。效果直观且时间相关性得以体现。效果直观且时间相关性得以体现。

【技术实现步骤摘要】
基于掩码的频谱预测解释方法及系统


[0001]本专利技术属于通信
,具体涉及一种基于掩码的频谱预测解释方法及系统。

技术介绍

[0002]频谱预测是一种从以往测量的频谱数据推断未来频谱使用相关信息的方法,本质上属于时间序列预测问题。目前深度学习技术在频谱预测领域取得了超过统计学模型的良好性能,但深度学习模型本身缺乏可解释性,这极大限制了用户对频谱预测结果的理解与信任,可解释问题因此成为智能频谱预测实用化需要解决的一个关键问题
[0003]目前,解释工作大都集中在图像领域,图像因其像素块本身具有意义,解释方法在图像的定性解释领域有其先天优势。在时间序列预测领域,特别是频谱预测领域,可解释方法的应用研究还未获得重视。与图像领域不同的是,频谱时序数据本身的含义并不明显,同时频谱数据具有相关性。如何解释并体现频谱预测中的相关性,并生成有意义的解释,是频谱预测解释研究需要解决的重点问题。现有的少量相关研究中,针对频谱序列预测问题中深度学习技术可解释性不足,包括解释效果不直观以及时间相关性难以体现等问题。

技术实现思路

[0004]技术问题:本专利技术提供一种基于掩码的频谱预测解释方法和系统,从而对频谱序列预测问题中深度学习技术进行直观的解释,并体现时间相关性。
[0005]技术方案:第一方面,本专利技术提供一种基于掩码方案的频谱预测解释方法,包括:
[0006]利用频谱数据集训练黑箱模型;
[0007]将待解释频谱序列输入训练好的黑箱模型,得到第一预测值;
[0008]根据待解释频谱序列和初始掩码矩阵,利用有意义扰动机制得到扰动矩阵;
[0009]将扰动矩阵输入训练好的黑箱模型,并以所述第一预测值作为基准值,利用基于掩码方案的损失函数进行优化,输出新的掩码矩阵;
[0010]根据所述新的掩码矩阵,利用显著图进行可视化解释。
[0011]进一步地,所述根据频谱序列和掩码矩阵,利用有意义扰动机制得到扰动矩阵包括:
[0012]利用如下公式得到扰动矩阵:
[0013]π2(M,X;t,f)=m
t,f
·
x
t,f
+(1

m
t,f
)
·
u
t,f
[0014][0015]其中,M表示掩码矩阵;t和t

表示时间步;f表示频点;x
t,f
表示待扰动时隙;m
t,f
表示掩码元素;u
t,f
表示按照公式生成的有意义扰动;K、W为正整数。
[0016]进一步地,所述训练好的黑箱模型为训练好的LSTM网络模型。
[0017]进一步地,所述掩码方案的损失函数为:
[0018]Ψ
a
(M)=L
e
(M)+μ
a
L
a
(M)+μ
p
L
p
(M)
[0019]其中,其中,L
e
(M)表示扰动后模型输出与原数据X对应模型输出g(X)之间的均方误差;L
a
(M)=‖vecsort(M)

r
a
‖2表示正则项,‖
·
‖表示向量2范数,vecsort(M)表示对掩码矩阵M进行矢量化,并按照掩码元素值从大到小的顺序重新排列;表示时间步正则项;μ
a
与μ
p
是相应正则项的正则系数。
[0020]进一步地,所述方法还包括利用MAPE作为预测精度指标。
[0021]第二方面,本专利技术提供一种基于掩码方案的频谱预测解释系统,包括:
[0022]模型训练模块,其被配置为利用频谱数据集训练黑箱模型;
[0023]第一预测模块,其被配置为将待解释频谱序列输入训练好的黑箱模型,得到第一预测值;
[0024]扰动模块,其被配置为根据待解释频谱序列和初始掩码矩阵,利用有意义扰动机制得到扰动矩阵;
[0025]掩码输出模块,其被配置为将扰动矩阵输入训练好的黑箱模型,并以所述第一预测值作为基准值,利用基于掩码方案的损失函数进行优化,输出新的掩码矩阵;
[0026]可视化模块,其被配置为根据所述新的掩码矩阵,利用显著图进行可视化解释。
[0027]进一步地,所述根据频谱序列和掩码矩阵,利用有意义扰动机制得到扰动矩阵包括:
[0028]利用如下公式得到扰动矩阵:
[0029]π2(M,X;t,f)=m
t,f
·
x
t,f
+(1

m
t,f
)
·
u
t,f
[0030][0031]其中,M表示掩码矩阵;t和t

表示时间步;f表示频点;x
t,f
表示待扰动时隙;m
t,f
表示掩码元素;u
t,f
表示按照公式生成的有意义扰动;K、W为正整数。
[0032]进一步地,所述训练好的黑箱模型为训练好的LSTM网络模型。
[0033]进一步地,所述掩码方案的损失函数为:
[0034]Ψ
a
(M)=L
e
(M)+μ
a
L
a
(M)+μ
p
L
p
(M)
[0035]其中,L
e
(M)表示扰动后模型输出与原数据X对应模型输出g(X)之间的均方误差;L
a
(M)=‖vecsort(M)

r
a
‖2表示正则项,‖
·
‖表示向量2范数,vecsort(M)表示对掩码矩阵M进行矢量化,并按照掩码元素值从大到小的顺序重新排列;表示时间步正则项;μ
a
与μ
p
是相应正则项的正则系数。
[0036]进一步地,所述系统还包括利用MAPE作为预测精度指标。
[0037]本专利技术首先,生成与输入频谱数据同样大小的重要性掩码矩阵,通过显著图标注输入数据的重要性部分,获得对单一样本预测结果的可视化解释;其次,将解释问题转变为针对掩码的多目标优化问题,根据频谱数据的动态特性与相关性特点,改进扰动方式,实现针对频谱预测问题的有意义扰动;最后,通过在优化目标中添加对时间步跳跃的惩罚项,体现了短的连续序列或者相邻时间步的时间相关性同样重要的先验知识。基于实测频谱数据
的测试分析表明,提出的解释方法克服了频谱序列预测问题中深度学习技术可解释性不足,解释效果直观且时间相关性得以体现。
附图说明
[0038]图1为本专利技术实施例中基于掩码方案的频谱预测解释方法的流程图;
[0039]图2为频谱预测黑盒模型示意图;
[0040]图3为有意义扰动示意图;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于掩码的频谱预测解释方法及系统,其特征在于,包括:利用频谱数据集训练黑箱模型;将待解释频谱序列输入训练好的黑箱模型,得到第一预测值;根据待解释频谱序列和初始掩码矩阵,利用有意义扰动机制得到扰动矩阵;将扰动矩阵输入训练好的黑箱模型,并以所述第一预测值作为基准值,利用基于掩码方案的损失函数进行优化,输出新的掩码矩阵;根据所述新的掩码矩阵,利用显著图进行可视化解释。2.根据权利要求1所述的方法,其特征在于,所述根据频谱序列和掩码矩阵,利用有意义扰动机制得到扰动矩阵包括:利用如下公式得到扰动矩阵:π2(M,X;t,f)=m
t,f
·
x
t,f
+(1

m
t,f
)
·
u
t,f
其中,X表示频谱序列;M表示掩码矩阵;t和t

表示时间步;f表示频点;x
t,f
表示待扰动时隙;m
t,f
表示掩码元素;u
t,f
表示按照公式生成的有意义扰动;K、W为正整数。3.根据权利要求1或2所述的方法,其特征在于,所述训练好的黑箱模型为训练好的LSTM网络模型。4.根据权利要求3所述的方法,其特征在于,所述掩码方案的损失函数为:Ψ
a
(M)=L
e
(M)+μ
a
L
a
(M)+μ
p
L
p
(M)其中,其中,L
e
(M)表示扰动后模型输出与原数据X对应模型输出g(X)之间的均方误差;L
a
(M)=||vecsort(M)

r
a
||2表示正则项,||
·
||表示向量2范数,vecsort(M)表示对掩码矩阵M进行矢量化,并按照掩码元素值从大到小的顺序重新排列;表示时间步正则项;μ
a
与μ
p
是相应正则项的正则系数。5.根据权利要求1所述的方法,其特征在于,所述方法还包括利用MAPE作为预测精度指标。6.一种基于掩码频谱预测解释系统,其特征在于,包括:模型训练模块...

【专利技术属性】
技术研发人员:张建照姚富强孔青柳永祥
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1