当前位置: 首页 > 专利查询>北京大学专利>正文

视觉优化方法、优化系统、计算机设备和可读存储介质技术方案

技术编号:22102354 阅读:23 留言:0更新日期:2019-09-14 03:29
本发明专利技术提出了一种视觉优化方法、视觉优化系统、计算机设备和计算机可读存储介质。其中,视觉优化方法包括:获取完成预训练的预设卷积神经网络以及预设问题的感知损失函数;根据预设问题的感知损失函数和预设卷积神经网络中预设层数对应的感知损失函数训练得出与预设层数对应的多个模型;根据预设指标评估多个模型;根据评估结果和预设指数权重规则获得多个模型中每个模型的权重;根据每个模型的权重和预设层数对应的感知损失函数获取优化的感知损失函数。本发明专利技术充分利用并整合了预训练好的网络从低层到高层,从局部到整体的语义信息,同时具有理论保障,实现了准确细微地指导两张图片的相似性。

Visual optimization methods, optimization systems, computer equipment and readable storage media

【技术实现步骤摘要】
视觉优化方法、优化系统、计算机设备和可读存储介质
本专利技术涉及视觉优化
,具体而言,涉及一种空视觉优化方法、视觉优化系统、计算机设备、计算机可读存储介质。
技术介绍
在视觉优化中,J.Johnson等人提出的感知损失函数是一种描述两张图片是否语义上相似的好方法。这种方法通过选取一个预训练好的网络(以vgg网络为例),比较训练集中生成去雨图片和真正去雨图片在vgg(现有预训练好的卷积神经网络的一种)网络某一层上的均方误差。但是,由于到底选取vgg的哪一层对结果的影响非常大。SATOSHIIIZUKA等人通过在生成式对抗网络中构造局部分辨器和全局分辨器的方式,从局部和整体两个角度判断两张图片是否相似。这种优化相比于采用预训练好的网络,会更倾向于过拟合训练集,从而影响泛化能力。YijunLi等人通过强调两张相同的图片语义分割结果应该相似,构造出了语义正则化函数。这个方法虽然利用了预训练好的网络,但是相同的语义分割结果是有可能对应不同的语义信息,所以可能无法细微地指导两张图片的相似性。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此,本专利技术第一个方面在于提出一种视觉优化方法。本专利技术的第二个方面在于提出一种视觉优化系统。本专利技术的第三个方面在于提出一种计算机设备。本专利技术的第四个方面在于提出一种计算机可读存储介质。有鉴于此,根据本专利技术的一个方面,提出了一种视觉优化方法,包括:获取完成预训练的预设卷积神经网络以及预设问题的感知损失函数;根据预设问题的感知损失函数和预设卷积神经网络中预设层数对应的感知损失函数训练得出与预设层数对应的多个模型;根据预设指标评估多个模型;根据评估结果和预设指数权重规则获得多个模型中每个模型的权重;根据每个模型的权重和预设层数对应的感知损失函数获取优化的感知损失函数。本专利技术提供的视觉优化方法,获取某个预训练好的卷积神经网络,和某个预设的具体问题的感知损失函数,在训练集上通过具体问题的感知损失函数与基于预训练好的网络的预设层数的感知损失函数训练出多个模型,选取某个预设判别评估指标评估多个模型,再利用评估得到的结果和指数权重算法规则得到每个模型的权重,用该权重对预设层数对应的感知损失函数进行预算,得到具体问题的感知损失函数与基于指数权重算法规则的优化感知损失函数,在得出最终的优化的感知损失函数的过程充分利用并整合了预训练好的网络从低层到高层,从局部到整体的语义信息,同时具有理论保障,实现了准确细微地指导两张图片的相似性。根据本专利技术的上述视觉优化方法,还可以具有以下技术特征:在上述技术方案中,优选地,根据预设问题的感知损失函数和预设卷积神经网络中预设层数对应的感知损失函数训练得出与预设层数对应的多个模型的步骤,具体包括:根据第一预设公式获取预设层数的感知损失函数:根据第二预设公式获得多个模型的感知损失函数:Pi′=L+Pi其中,Pi为预设卷积神经网络第i层对应的感知损失函数,Vi(·)为从预设卷积神经网络的输入到预设卷积神经网络的第i层的变换,训练集rainingset为(Xj,Yj),size(Vi(Xj))为Vi(Xj)的大小,#(·)为训练集的大小,Pi′为第i个模型的感知损失函数,L为预设问题的感知损失函数。在该技术方案中,选取预设的某个训练好的网络中的预设层数,可以是该预训练好的网络中一部分层数,也可以是该预训练好的网络中全部的卷积层,根据在训练集训练选取的层数,根据第一预设公式和第二预设公式得出每个模型的损失函数,利用损失函数训练出多个模型。在上述任一技术方案中,优选地,根据预设指标评估多个模型的步骤,具体包括:根据第三预设公式获得Oi(Xj)与Yj的相似性:其中,Oi(Xj)为第i个模型的输出,E(·,·)为预设指标,训练集rainingset为(Xj,Yj),为Oi(Xj)与Yj的相似性。在该技术方案中,选取特定的评价指标E(·,·)来评估每个模型,利用第三预设公式得出每个模型的输出与Yj的相似性,实现对训练得出的每个模型的评估。在上述任一技术方案中,优选地,根据评估结果和预设指数权重规则获得多个模型中每个模型的权重的步骤,具体包括:根据第四预设公式获得每个模型的权重:其中,wi为第i个模型的权重,vgg为预设卷积神经网络。在该技术方案中,基于利用第四预设公式得出的每个模型的评估结果利用第四预设公式(指数权重算法)得到每个模型的权重,预设卷积神经网络可以根据情况选定,比如选取vgg(现有预训练好的卷积神经网络的一种)。得出的各个模型的权重为得出最终优化感知损失函数提供依据。在上述任一技术方案中,优选地,根据每个模型的权重和预设层数对应的感知损失函数获取优化的感知损失函数的步骤,具体包括:根据第五预设公式获得优化的感知损失函数:其中,L'为优化的感知损失函数,L为预设问题的感知损失函数,vgg为预设卷积神经网络,wi为第i个模型的权重,vgg为预设卷积神经网络。在该技术方案中,通过每个模型的权重对预训练好的网络的各个层对应的模型的损失函数做加权平均,用L'=∑i∈vggwi(L+Pi)=L+∑i∈vggwiPi作为经过指数权重算法的视觉优化的损失函数。该视觉优化的损失函数是根据具体问题的感知损失函数与基于指数权重算法规则得到的,在得出最终的优化的感知损失函数的过程充分利用并整合了预训练好的网络从低层到高层,从局部到整体的语义信息,同时具有理论保障,实现了准确细微地指导两张图片的相似性。根据本专利技术的第二个方面,提出了一种视觉优化系统,包括:获取单元,用于获取完成预训练的预设卷积神经网络以及预设问题的感知损失函数;训练单元,用于根据预设问题的感知损失函数和预设卷积神经网络中预设层数对应的感知损失函数训练得出与预设层数对应的多个模型;评估单元,用于根据预设指标评估多个模型;权重单元,用于根据评估结果和预设指数权重规则获得多个模型中每个模型的权重;优化单元,用于根据每个模型的权重和预设层数对应的感知损失函数获取优化的感知损失函数。本专利技术提供的视觉优化系统,获取某个预训练好的卷积神经网络,和某个预设的具体问题的感知损失函数,在训练集上通过具体问题的感知损失函数与基于预训练好的网络的预设层数的感知损失函数训练出多个模型,选取某个预设判别评估指标评估多个模型,再利用评估得到的结果和指数权重算法规则得到每个模型的权重,用该权重对预设层数对应的感知损失函数进行预算,得到具体问题的感知损失函数与基于指数权重算法规则的优化感知损失函数,在得出最终的优化的感知损失函数的过程充分利用并整合了预训练好的网络从低层到高层,从局部到整体的语义信息,同时具有理论保障,实现了准确细微地指导两张图片的相似性。根据本专利技术的上述视觉优化系统,还可以具有以下技术特征:在上述技术方案中,优选地,训练单元具体包括:第一计算单元,用于根据第一预设公式获取预设层数的感知损失函数:第二计算单元,用于根据第二预设公式获得多个模型的感知损失函数:Pi′=L+Pi其中,Pi为预设卷积神经网络第i层对应的感知损失函数,Vi(·)为从预设卷积神经网络的输入到预设卷积神经网络的第i层的变换,训练集rainingset为(Xj,Yj),size(Vi(Xj))为Vi(Xj)的大小,#(·)为训练集的大小,P本文档来自技高网...

【技术保护点】
1.一种视觉优化方法,其特征在于,包括:获取完成预训练的预设卷积神经网络以及预设问题的感知损失函数;根据所述预设问题的感知损失函数和所述预设卷积神经网络中预设层数对应的感知损失函数训练得出与所述预设层数对应的多个模型;根据预设指标评估所述多个模型;根据评估结果和预设指数权重规则获得所述多个模型中每个模型的权重;根据所述每个模型的权重和所述预设层数对应的感知损失函数获取优化的感知损失函数。

【技术特征摘要】
1.一种视觉优化方法,其特征在于,包括:获取完成预训练的预设卷积神经网络以及预设问题的感知损失函数;根据所述预设问题的感知损失函数和所述预设卷积神经网络中预设层数对应的感知损失函数训练得出与所述预设层数对应的多个模型;根据预设指标评估所述多个模型;根据评估结果和预设指数权重规则获得所述多个模型中每个模型的权重;根据所述每个模型的权重和所述预设层数对应的感知损失函数获取优化的感知损失函数。2.根据权利要求1所述的视觉优化方法,其特征在于,所述根据所述预设问题的感知损失函数和所述预设卷积神经网络中预设层数对应的感知损失函数训练得出与所述预设层数对应的多个模型的步骤,具体包括:根据第一预设公式获取所述预设层数的感知损失函数:根据第二预设公式获得所述多个模型的感知损失函数:Pi′=L+Pi其中,Pi为所述预设卷积神经网络第i层对应的感知损失函数,Vi(·)为从所述预设卷积神经网络的输入到所述预设卷积神经网络的第i层的变换,训练集rainingset为(Xj,Yj),size(Vi(Xj))为Vi(Xj)的大小,#(·)为所述训练集的大小,Pi′为第i个模型的感知损失函数,L为所述预设问题的感知损失函数。3.根据权利要求1所述的视觉优化方法,其特征在于,所述根据预设指标评估所述多个模型的步骤,具体包括:根据第三预设公式获得Oi(Xj)与Yj的相似性:其中,Oi(Xj)为第i个模型的输出,E(·,·)为所述预设指标,训练集rainingset为(Xj,Yj),为Oi(Xj)与Yj的相似性。4.根据权利要求3所述的视觉优化方法,其特征在于,所述根据评估结果和预设指数权重规则获得所述多个模型中每个模型的权重的步骤,具体包括:根据第四预设公式获得所述每个模型的权重:其中,wi为第i个模型的权重,vgg为所述预设卷积神经网络。5.根据权利要求1至4中任一项所述的视觉优化方法,其特征在于,所述根据所述每个模型的权重和所述预设层数对应的感知损失函数获取优化的感知损失函数的步骤,具体包括:根据第五预设公式获得所述优化的感知损失函数:其中,L'为所述优化的感知损失函数,L为所述预设问题的感知损失函数,vgg为所述预设卷积神经网络,wi为第i个模型的权重,vgg为所述预设卷积神经网络。6.一种视觉优化系统,其特征在于,包括:获取单元,用于获取完成预训练的预设卷积神经网络以及预设问题的感知损...

【专利技术属性】
技术研发人员:刘家瑛杜昆泰杨文瀚郭宗明
申请(专利权)人:北京大学北大方正集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1