一种基于表征波动的不确定性可靠性推理方法及相关设备技术

技术编号:36884748 阅读:20 留言:0更新日期:2023-03-15 21:27
本发明专利技术公开了一种基于表征波动的不确定性可靠性推理方法及相关设备,方法包括:获取目标测试数据,将所述目标测试数据输入至目标神经网络模型,以获取所述目标神经网络模型中的目标响应序列;根据所述目标响应序列获取所述目标神经网络模型的表征波动性;根据所述目标神经网络模型的表征波动性获取所述目标神经网络模型的不确定性可靠程度。本发明专利技术通过计算训练好的神经网络模型的表征波动性推理出神经网络模型的不确定性可靠程度,实现了更准确的评估出神经网络模型的不确定性的质量的效果。效果。效果。

【技术实现步骤摘要】
一种基于表征波动的不确定性可靠性推理方法及相关设备


[0001]本专利技术涉及评估神经网络的
,特别涉及一种基于表征波动的不确定性可靠性推理方法及相关设备。

技术介绍

[0002]不确定性评估对许多真实世界的应用有至关重要的作用,尤其是对已经部署的神经网络模型。在安全性要求较高的领域,比如医疗诊断、自动驾驶等,神经网络模型需要准确地评估对其预测结果的确定程度,即量化预测不确定性。在这种情况下,经过良好校准的不确定性估计会传达有关何时应该信任模型的输出的信息。
[0003]最近已经有许多概率深度学习方法被提出,包括贝叶斯和非贝叶斯方法,用于量化预测不确定性。神经网络的预测不确定性评估的一种常用方法是依赖贝叶斯方法,核心是计算神经网络参数的后验分布。然而,精确的贝叶斯推理通常是难以处理的,因此只能近似地计算后验,实际场景中通常使用近似的贝叶斯推理方法。Monte

CarloDropout(MC

Dropout)是一种被广泛使用的不确定性评估方法,可以看作近似贝叶斯推理。Dropout技术通常是在训练期间随机丢弃一定比例的神经元,起到正则化以防止过拟合。MC

Dropout在推理预测过程中也使用dropout来估计预测分布。开启dropout后,每次预测的结果不是固定的,每次前向传递都可以看作是从网络权重的后验分布中采样。多次随机前向传递的均值和方差分别是预测结果和预测不确定性。
[0004]在理想状态下,基于MC

Dropout的不确定性评估方法是可靠的,即其可以量化何时可以信任模型的预测结果。但是,在实际场景中,由于训练数据中存在错误,比如在评估神经网络模型时,由于摄像头不够清晰和不同天气等导致的数据噪声、人工的错误标注等原因,基于MC

Dropout的不确定性评估结果不一定准确。此外,对数据集的质量进行评估难度很高,对不确定性评估结果是否正确没有标准答案,对不确定评估方法的可靠性进行分析是亟需解决的一个问题。然而,现有技术中的预测不确定性的质量评估方法中,预期校准误差的结果受分组个数的影响,无法准确衡量一些特殊情况下的神经网络模型的不确定性的质量,衡量神经网络模型的不确定性评估的可靠性的方法不够准确。
[0005]因此,现有技术还有待改进和提高。

技术实现思路

[0006]针对现有技术的上述缺陷,本专利技术提供一种基于表征波动的不确定性可靠性推理方法、装置、终端及存储介质,旨在解决现有技术中衡量神经网络模型的不确定性评估的可靠性的方法不够准确的问题。
[0007]为了解决上述技术问题,本专利技术所采用的技术方案如下:
[0008]本专利技术的第一方面,提供一种基于表征波动的不确定性可靠性推理方法,所述方法包括:
[0009]获取目标测试数据,将所述目标测试数据输入至目标神经网络模型,以获取所述
目标神经网络模型中的目标响应序列;
[0010]根据所述目标响应序列获取所述目标神经网络模型的表征波动性;
[0011]根据所述目标神经网络模型的表征波动性获取所述目标神经网络模型的不确定性可靠程度。
[0012]所述的基于表征波动的不确定性可靠性推理方法,其中,所述目标测试数据为多个。
[0013]所述的基于表征波动的不确定性可靠性推理方法,其中,所述获取目标测试数据,将所述目标测试数据输入至目标神经网络模型,以获取所述目标神经网络模型中的目标响应序列,包括:
[0014]分别将多个所述目标测试数据输入至所述目标神经网络模型中的倒数第二层中的每个神经元中,以获取每个所述神经元对应的所述目标响应数据序列。
[0015]所述的基于表征波动的不确定性可靠性推理方法,其中,所述根据所述目标响应序列获取所述目标神经网络模型的表征波动性,包括:
[0016]根据所述目标响应数据序列获取对应的所述神经元的表征波动性;
[0017]根据每个所述神经元的表征波动性获取所述目标神经网络模型的表征波动性。
[0018]所述的基于表征波动的不确定性可靠性推理方法,其中,所述根据所述目标响应数据序列获取对应的所述神经元的表征波动性,包括:
[0019]第i个所述神经元的表征波动性为:
[0020][0021]其中,为第i个所述神经元的所述目标响应数据序列,std表示计算标准差。
[0022]所述的基于表征波动的不确定性可靠性推理方法,其中,所述根据每个所述神经元的表征波动性获取所述目标神经网络模型的表征波动性,包括:
[0023]将所述目标神经网络中倒数第二层的所有神经元的表征波动性的平均值作为所述目标神经网络模型的表征波动性。
[0024]所述的基于表征波动的不确定性可靠性推理方法,其中,所述根据所述目标神经网络模型的表征波动性获取所述目标神经网络模型的不确定性可靠程度,包括:
[0025]所述目标神经网络模型的表征波动性越小,所述目标神经网络模型的不确定性可靠程度越高。
[0026]本专利技术的第二方面,提供一种基于表征波动的不确定性可靠性推理装置,包括:
[0027]目标数据获取模块,所述目标数据获取模块用于获取目标测试数据,将所述目标测试数据输入至目标神经网络模型,以获取所述目标神经网络模型中的目标响应序列;
[0028]表征波动性获取模块,所述表征波动性获取模块用于根据所述目标响应序列获取所述目标神经网络模型的表征波动性;
[0029]不确定性可靠程度获取模块,所述不确定性可靠程度获取模块用于根据所述目标神经网络模型的表征波动性获取所述目标神经网络模型的不确定性可靠程度。
[0030]本专利技术的第三方面,提供一种终端,所述终端包括处理器、与处理器通信连接的计算机可读存储介质,所述计算机可读存储介质适于存储多条指令,所述处理器适于调用所
述计算机可读存储介质中的指令,以执行实现上述任一项所述的基于表征波动的不确定性可靠性推理方法的步骤。
[0031]本专利技术的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述任一项所述的基于表征波动的不确定性可靠性推理方法的步骤。
[0032]与现有技术相比,本专利技术提供了一种基于表征波动的不确定性可靠性推理方法及相关设备,所述的基于表征波动的不确定性可靠性推理方法,通过获取目标测试数据,将所述目标测试数据输入至目标神经网络模型,以获取所述目标神经网络模型中的目标响应序列,再根据所述目标响应序列获取所述目标神经网络模型的表征波动性,最后,根据所述目标神经网络模型的表征波动性获取所述目标神经网络模型的不确定性可靠程度。本专利技术所提出的基于表征波动的不确定性可靠性推理方法,通过计算训练好的神经网络模型的表征波动性推理出神经网络模型的不确定性可靠程度,在特殊情况下也能够衡量神经网络模型中的不确定性的质量,实现了更准确的评估出神经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于表征波动的不确定性可靠性推理方法,其特征在于,所述基于表征波动的不确定性可靠性推理方法包括:获取目标测试数据,将所述目标测试数据输入至目标神经网络模型,以获取所述目标神经网络模型中的目标响应序列;根据所述目标响应序列获取所述目标神经网络模型的表征波动性;根据所述目标神经网络模型的表征波动性获取所述目标神经网络模型的不确定性可靠程度。2.根据权利要求1所述的基于表征波动的不确定性可靠性推理方法,其特征在于,所述目标测试数据为多个。3.根据权利要求2所述的基于表征波动的不确定性可靠性推理方法,其特征在于,所述获取目标测试数据,将所述目标测试数据输入至目标神经网络模型,以获取所述目标神经网络模型中的目标响应序列,包括:分别将多个所述目标测试数据输入至所述目标神经网络模型中的倒数第二层中的每个神经元中,以获取每个所述神经元对应的所述目标响应数据序列。4.根据权利要求3所述的基于表征波动的不确定性可靠性推理方法,其特征在于,所述根据所述目标响应序列获取所述目标神经网络模型的表征波动性,包括:根据所述目标响应数据序列获取对应的所述神经元的表征波动性;根据每个所述神经元的表征波动性获取所述目标神经网络模型的表征波动性。5.根据权利要求4所述的基于表征波动的不确定性可靠性推理方法,其特征在于,所述根据所述目标响应数据序列获取对应的所述神经元的表征波动性,包括:第i个所述神经元的表征波动性为:其中,为第i个所述神经元的所述目标响应数据序列,std表示计算标准差。6.根据权利要求4所述的基于表征波动的不确定性可靠性推理方法,其特征在于,所述根据每个所述神经元的表征波动性获取所述...

【专利技术属性】
技术研发人员:潘超袁博姚新周维
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1