一种基于深度学习的场景识别方法和系统技术方案

技术编号:24800433 阅读:32 留言:0更新日期:2020-07-07 21:11
本发明专利技术公开了一种基于深度学习的场景识别方法和系统,采用多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度层,所述方法包括:设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;获取所述场景图像的图像分辨率;根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。本发明专利技术将场景图像的分辨率作为其对多尺度卷积神经网络进行训练的影响权值,也就是说,越清晰的场景图像可以使得多尺度卷积神经网络训练后的准确率更高。

【技术实现步骤摘要】
一种基于深度学习的场景识别方法和系统
本专利技术涉及,尤其涉及一种基于深度学习的场景识别方法和系统。
技术介绍
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。场景识别(placerecognition)是一类很常见的图像处理任务。给定一张图片,要求识别出这张图片中出现的场景。识别的结果既可以是具体的地理位置,也可以是该场景的名称,还可以是数据库中的某个同样的场景。孙昊于2017年5月提出了一种《基于深度卷积神经网络的场景分类研究》,其公开了一种端到端的多尺本文档来自技高网...

【技术保护点】
1.一种基于深度学习的场景识别方法,采用多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度层,其特征在于:所述方法包括:/n设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;/n获取所述场景图像的图像分辨率;/n根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。/n

【技术特征摘要】
1.一种基于深度学习的场景识别方法,采用多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度层,其特征在于:所述方法包括:
设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;
获取所述场景图像的图像分辨率;
根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。


2.根据权利要求1所述的一种基于深度学习的场景识别方法,其特征在于:所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值L,包括:
所述分辨率范围越低,所述图像处理参数的数值越小;所述分辨率范围越高,所述图像处理参数的数值越大。


3.根据权利要求1所述的一种基于深度学习的场景识别方法,其特征在于:所述设置分辨率级别包括:
根据场景复杂度,设置所述分辨率级别。


4.根据权利要求1或2所述的一种基于深度学习的场景识别方法,其特征在于:所述的分辨率级别为三级,分别为低级、中级和高级。


5.根据权利要求4所述的一种基于深度学习的场景识别方法,其特征在于:所述多尺度化处理的最大尺度值为三层,所述场景图像输入所述多尺度卷积神经网络的最大次数为三;当分辨率级别为低级时,多尺度化处理的尺度值为一层,场景图像输入所述多尺度卷积神经网络的次数为一;当分辨率级别为中级时,多尺度化处理的尺度值为二层,场景图像输入所述多尺度卷积神经网络的次数为二;当分辨率级别为高级时,多尺度化处理的尺度值为三层,场景图像输入所述多尺度卷积神经网络的次数为三。


6.一种基于深度学习的场景识别系统,包括多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度...

【专利技术属性】
技术研发人员:赵亦为
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1