一种基于视觉域局部自适应的计算机视觉深度学习方法技术

技术编号:19747348 阅读:56 留言:0更新日期:2018-12-12 05:06
本发明专利技术中提出的一种基于视觉域局部自适应的计算机视觉深度学习方法,其主要内容包括:视觉域定位、目标和域信息融合、局部自适应架构的实现和局部自适应实验评估,其过程为,首先将源图像和目标图像输入到一个神经卷积网络中,这个网络在图像网上进行了预训练;然后,用单元相乘将目标与域信息融合,以获取不同域的共有区域的卷积映射;接下来,执行一个最大池化层,紧接着对两个连接层进行规范化调整;最后,在Softmax层中根据源数据对目标进行分类。本方法采用了局部自适应架构,具有强大的空间存储,能够使计算机视觉实验结果更加显著,并且能够处理源图像中的局部微小的特征信息。

【技术实现步骤摘要】
一种基于视觉域局部自适应的计算机视觉深度学习方法
本专利技术涉及深度学习领域,尤其是涉及了一种基于视觉域局部自适应的计算机视觉深度学习方法。
技术介绍
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,并且使电脑处理结果成为更适合人眼观察或传送给仪器检测的图像。在医学领域,可应用计算机视觉技术从显微镜图像、X射线图像、血管造影图像等应用图像中提取用于对患者进行医疗诊断的特征信息,从而能够准确及时地对患者采取相应的救治措施;在工业领域,可应用计算机视觉技术对制造工序进行管理,从而实现对产品的质量控制;在军事领域,应用计算机视觉技术可探测敌方目标的具体位置,以进行精确打击;另外,计算机视觉技术在导航、监控和视觉特效制作等领域都有着广泛的应用。然而,现有的计算机视觉深度学习方法存在处理图像得到的结果不显著,并且不能处理源图像中的局部微小的特征信息等问题。本专利技术中提出的一种基于视觉域局部自适应的计算机视觉深度学习方法,先将源图像和目标图像输入到一个神经卷积网络中,这个网络在图像网上进行了预训练;然后,用单元相乘将目标与域信息融合,以获取不同域的共有区域的卷积映射;接下来,执行一个最大池化层,紧接着对两个连接层进行规范化调整;最后,在Softmax层中根据源数据对目标进行分类。本方法采用了局部自适应架构,具有强大的空间存储,能够使计算机视觉实验结果更加显著,并且能够处理源图像中的局部微小的特征信息。
技术实现思路
针对现有的计算机视觉深度学习方法存在处理图像得到的结果不显著,并且不能处理源图像中的局部微小的特征信息等问题,本专利技术的目的在于提供一种基于视觉域局部自适应的计算机视觉深度学习方法,先将源图像和目标图像输入到一个神经卷积网络中,这个网络在图像网上进行了预训练;然后,用单元相乘将目标与域信息融合,以获取不同域的共有区域的卷积映射;接下来,执行一个最大池化层,紧接着对两个连接层进行规范化调整;最后,在Softmax层中根据源数据对目标进行分类。为解决上述问题,本专利技术提供一种基于视觉域局部自适应的计算机视觉深度学习方法,其主要内容包括:(一)视觉域定位;(二)目标和域信息融合;(三)局部自适应架构的实现;(四)局部自适应实验评估。其中,所述的视觉域局部自适应,主要是通过建立一个基于目标域的模型,对源域中的已标记数据进行训练,在训练过程中令目标域中的未标记样本作为辅助信息,以达到在源域和目标域分布概率不同的情况下进行学习的目的。其中,所述的视觉域定位,将源图像和目标图像输入到一个神经卷积网络中,这个网络在图像网上进行了预训练,并且在一个单独的S形单元上进行微调以进行二元分类;采用yc=f(x)表示最后一个卷积层的Softmax函数的得分;最后一个卷积层会生成n=1,…,N个特征映射(其中i,j在宽度u和高度v之内),这些特征映射包含空间信息,能够通过计算一系列导数估计它们对最终得分的贡献,对这些函数进行如下计算可得到:权重值可用来定义一个修正权重线性特征映射集合:这个集合可视作一个粗略的热图;为了使热图可视化,可通过双线性内插算法对热图进行升级,并且可用热图来鉴别视觉域(c=1时为特殊域,c=2时为普通域);所得到的热图即为域映射。其中,所述的目标和域信息融合,首先网络在预训练过程中会生成一个深度卷积网络特征映射C和同等尺寸的滤波器W(在最后一个卷积层);然后,用单元相乘M=C⊙W将目标与域信息融合,以获取不同域的共有区域的卷积映射。进一步地,所述的滤波器,可用以下公式表示:其中,n=1,…,N;此公式包含了该滤波器对于特定分类过程所做贡献的信息;其中,ReLU函数(线性整流函数)经过了严格筛选,可将图像滤波器的灰度区像素减少到零。其中,所述的局部自适应架构的实现,主要采用Torch7(一个深度学习架构)进行;在域定位实现后,执行一个最大池化层,这个池化层是Torch7的一个扩展;紧接着对两个连接层进行规范化调整;最后在Softmax层中根据源数据对目标进行分类。进一步地,所述的Torch7,是一个多功能的数字计算框架和机器学习库,其目标是提供一个灵活的环境来设计和训练机器学习;由于使用了简单快捷的脚本语言,运行起来非常简单且高效;在局部自适应架构中,Torch7可以实现单元相乘和串联过程,并且可用来生成滤波器集成层。其中,所述的局部自适应实验评估,主要包括实验设置和实验分析。进一步地,所述的实验设置,采用转换数据集进行实验,转换数据集包括了150个目标,这些目标被平均分配到15个类别之中;每个目标都会发生变化,这是由于每个目标的获取都经历了一个独立的视觉转换过程;实验主要进行了两个方面的测试:转换和尺寸缩扩;对于转换测试,以照相机为圆心从左到右对目标进行旋转拍摄,总共拍摄150张照片,取前50张作为源图像,取后50张作为目标图像,然后基于转换数据集进行域适应;对于尺寸缩扩测试,将目标置于远离照相机的位置,然后逐步向照相机靠近进行拍摄,总共拍摄150张照片,取前50张作为源图像,取后50张作为目标图像,然后基于转换数据集进行域适应。进一步地,所述的实验分析,主要通过分析在转换和尺寸缩扩的自适应过程中域差的降低程度,来评估局部适应架构的性能。附图说明图1是本专利技术一种基于视觉域局部自适应的计算机视觉深度学习方法的系统流程图。图2是本专利技术一种基于视觉域局部自适应的计算机视觉深度学习方法的视觉域定位网络图。图3是本专利技术一种基于视觉域局部自适应的计算机视觉深度学习方法的实验方法图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本专利技术作进一步详细说明。图1是本专利技术一种基于视觉域局部自适应的计算机视觉深度学习方法的系统流程图。主要包括:视觉域定位、目标和域信息融合、局部自适应架构的实现和局部自适应实验评估。视觉域局部自适应,主要是通过建立一个基于目标域的模型,对源域中的已标记数据进行训练,在训练过程中令目标域中的未标记样本作为辅助信息,以达到在源域和目标域分布概率不同的情况下进行学习的目的。目标和域信息融合,首先网络在预训练过程中会生成一个深度卷积网络特征映射C和同等尺寸的滤波器W(在最后一个卷积层);然后,用单元相乘M=C⊙W将目标与域信息融合,以获取不同域的共有区域的卷积映射。其中,滤波器,可用以下公式表示:其中,n=1,…,N;此公式包含了该滤波器对于特定分类过程所做贡献的信息;其中,ReLU函数(线性整流函数)经过了严格筛选,可将图像滤波器的灰度区像素减少到零。局部自适应架构的实现,主要采用Torch7(一个深度学习架构)进行;在域定位实现后,执行一个最大池化层,这个池化层是Torch7的一个扩展;紧接着对两个连接层进行规范化调整;最后在Softmax层中根据源数据对目标进行分类。其中,Torch7,是一个多功能的数字计算框架和机器学习库,其目标是提供一个灵活的环境来设计和训练机器学习;由于使用了简单快捷的脚本语言,运行起来非常简单且高效;在局部自适应架构中,Torch7可以实现单元相乘和串联过程,并且可用来生成滤波器集成层。局部自适应实验评估,主要本文档来自技高网...

【技术保护点】
1.一种基于视觉域局部自适应的计算机视觉深度学习方法,其特征在于,主要包括视觉域定位(一);目标和域信息融合(二);局部自适应架构的实现(三);局部自适应实验评估(四)。

【技术特征摘要】
1.一种基于视觉域局部自适应的计算机视觉深度学习方法,其特征在于,主要包括视觉域定位(一);目标和域信息融合(二);局部自适应架构的实现(三);局部自适应实验评估(四)。2.基于权利要求书1所述的视觉域局部自适应,其特征在于,主要是通过建立一个基于目标域的模型,对源域中的已标记数据进行训练,在训练过程中令目标域中的未标记样本作为辅助信息,以达到在源域和目标域分布概率不同的情况下进行学习的目的。3.基于权利要求书1所述的视觉域定位(一),其特征在于,将源图像和目标图像输入到一个神经卷积网络中,这个网络在图像网上进行了预训练,并且在一个单独的S形单元上进行微调以进行二元分类;采用yc=f(x)表示最后一个卷积层的Softmax函数的得分;最后一个卷积层会生成n=1,…,N个特征映射(其中i,j在宽度u和高度v之内),这些特征映射包含空间信息,能够通过计算一系列导数估计它们对最终得分的贡献,对这些函数进行如下计算可得到:权重值可用来定义一个修正权重线性特征映射集合:这个集合可视作一个粗略的热图;为了使热图可视化,可通过双线性内插算法对热图进行升级,并且可用热图来鉴别视觉域(c=1时为特殊域,c=2时为普通域);所得到的热图即为域映射。4.基于权利要求书1所述的目标和域信息融合(二),其特征在于,首先网络在预训练过程中会生成一个深度卷积网络特征映射C和同等尺寸的滤波器W(在最后一个卷积层);然后,用单元相乘将目标与域信息融合,以获取不同域的共有区域的卷积映射。5.基于权利要求书4所述的滤波器,其特征在于,可用以下公式表示:其中,n=1,…,N;此公式包含了该滤波器对于特定分类过程所做贡献的信息;其中,ReLU函数(...

【专利技术属性】
技术研发人员:夏春秋
申请(专利权)人:深圳市唯特视科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1