基于贝叶斯线性的图像识别方法、装置、设备和介质制造方法及图纸

技术编号:37351245 阅读:23 留言:0更新日期:2023-04-27 07:02
本发明专利技术实施例公开了基于贝叶斯线性的图像识别方法、装置、电子设备和存储介质,通过获取待识别图像;将待识别图像输入预训练的卷积神经网络模型进行目标识别,卷积神经网络模型包括基于贝叶斯线性的通道注意力模块,通道注意力模块用于对输入的初始多维特征进行平均池化,得到池化特征,对池化特征进行贝叶斯线性,得到线性特征,将线性特征扩展到与初始多维特征的维度相同,并与初始多维特征相乘,得到通道注意力模块的输出多维特征,卷积神经网络模块基于输出多维特征对待识别图像进行图像识别;输出卷积神经网络模型对待识别图像的识别结果。解决现有模型参数较多、先验分布给定问题,可以有效地对图像的不确定性进行预测。测。测。

【技术实现步骤摘要】
基于贝叶斯线性的图像识别方法、装置、设备和介质


[0001]本专利技术实施例涉及图像处理
,尤其涉及基于贝叶斯线性的图像识别方法、装置、电子设备和存储介质。

技术介绍

[0002]CNN(Convolutional Neural Network,卷积神经网络)基于观测到的数据(训练样本)通过反向传播训练模型,获得模型参数的最优点估计,支持模型输出确定性结果。这种基于参数最优点估计训练的CNN网络能较好地拟合观测到的数据,但不能较好地预测未观测到的数据(测试样本),即产生了对现有训练样本的过度拟合。尽管现有的正则化方法可以一定程度缓解过拟合,如early stopping、权值衰减、L1

L2正则化、dropout等,但模型本身不能度量不确定性。以分类任务来说,softmax函数通过压缩其他类的输出概率得分来最大化给定类的输出概率得分,这种概率不是模型对输出给定类的置信度。
[0003]为提升CNN模型的泛化能力,支持模型度量不确定性,现有的研究引入了贝叶斯(Bayesian)方法,得到BCNN(Bayesian本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于贝叶斯线性的图像识别方法,其特征在于,包括:获取待识别图像;将所述待识别图像输入预训练的卷积神经网络模型进行目标识别,所述卷积神经网络模型包括基于贝叶斯线性的通道注意力模块,所述通道注意力模块用于对输入的初始多维特征进行平均池化得到池化特征,对所述池化特征进行贝叶斯线性,得到线性特征,将所述线性特征扩展到与所述初始多维特征的维度相同,并与所述初始多维特征相乘,得到所述通道注意力模块的输出多维特征,所述卷积神经网络模块基于所述输出多维特征对所述待识别图像进行图像识别;输出所述卷积神经网络模型对所述待识别图像的识别结果。2.根据权利要求1所述的方法,其特征在于,所述通道注意力模块的目标函数为最小化模型参数的分布和真实贝叶斯后验分布的KL散度。3.根据权利要求1所述的方法,其特征在于,所述目标函数表示为:其中,q(ω|θ)表示模型参数ω关于参数θ的分布,p(ω)表示模型参数ω的先验分布,p(y|x,ω)表示所述贝叶斯线性对应的概率模型,y表示在输入x和最小化模型参数ω的条件下的输出。4.根据权利要求2所述的方法,其特征在于,所述目标函数表示为:其中,p(ω|θ)表示最小化模型参数ω关于参数θ的分布,p(ω)表示模型参数ω的先验分布,p(y|x,ω)表示所述贝叶斯线性层对应的概率模型,y表示在输入x和最小化模型参数ω的条件下的输出。5.根据权利要求4所述的方法,其特征在于,所述最小化模型参数ω关于参数θ的分布为对角高斯分布,所述模型参数ω的采样为标准高斯,所述参数θ=(μ,ρ),其中:μ

μ

λΔμρ

ρ

λΔρ其中,λ是学习...

【专利技术属性】
技术研发人员:方建生
申请(专利权)人:广州视源人工智能创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1