The invention discloses a road automatic recognition method based on the full convolution neural network and the CRF technology. Step 1, obtain the UAV aerial video stream and decode the UAV aerial video video; step two, get the aerial picture in the UAV aerial video stream; step three, read the input picture; step four, read the specified mode. Type, if no model is specified, read the default model; step five, predict the picture; step six, save the predicted picture in PNG format. This invention adopts the depth learning method of the multichannel full convolution neural network, combined with the CRF algorithm which is approximated by the recurrent neural network, the migration learning and the existing UAV video stream processing method to record the video by the unmanned aerial vehicle mounted aerial photo equipment in flight, so that the road network and the surrounding target are completed automatically. And the maximum accuracy of UAV aerial road recognition is improved. One
【技术实现步骤摘要】
基于全卷积神经网络与CRF技术的道路自动识别方法
本专利技术涉及无人机航拍图像处理,计算机视觉,深度学习,迁徙学习,具体而言,涉及运用基于全卷积神经网络的深度学习技术自动标识无人机航拍图片中的道路以及周边目标技术。
技术介绍
目前道路识别现状:目前对无人机航拍图片的道路标识技术大多是手工的,半自动的(依赖人工和计算机同时操作),少数运用图片中的部分特征如色彩、形状等进行自动标识。手工做法虽然可以保证一定的标识准确率,无需强大计算能力的机器,但是严重依赖拥有专业知识的技术人员。因此,此方法很难甚至无法应用于大规模的大图片的道路标识。自动航拍图中的道路可以有效避免上述的人力资源问题,却受限于标识的精确度。如图1所示,现有技术中的道路识别方法。附图来源:http://bbs.dji.com/thread-24617-1-1.html。目前基于深度学习的目标识别的研究情况:在计算机视觉领域,深度学习方法已被证实将会有效提高标识准确率。在论文“LeaningtoDetectRoadsinHigh-ResolutionAerialImages”中,作者Mnih,Hinton提到他们的深度学习方法在检测美国马萨诸塞州航拍图片中已领先于其他非深度学习方法达7%。如图2所示:《Minh与Hinton的深度学习,传统方法道路识别比较》,其中名称为other的曲线为非深度学习方法效果,其余均为深度学习方法效果。以曲线覆盖面积(AUC)评定算法优劣可见,深度学习方法胜于非深度学习方法。如图3所示:《深度学习与传统方法的对比》,左图,右图分别为非深度学习,深度学习方法的预测结果。图 ...
【技术保护点】
1.一种基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:
【技术特征摘要】
1.一种基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:步骤一、获取无人机航拍视频流并对无人机航拍视频进行解码;步骤二、从无人机航拍视频流中获得航拍图片;步骤三、读取此输入图片;步骤四、读取指定模型,若没有指定模型,读取默认模型;步骤五、对图片进行预测;步骤六、将预测好的图片以png格式保存。2.根据权利要求1所述的基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:解码H264视频流,并通过ffmpeg将视频流转化为RGB图像。3.根据权利要求1所述的基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:通过多通道全卷积神经网络架构,对航拍图片进行划窗操作分析:首先将航拍图片分割成多个64*64的区域(窗口)块,将64*64的区域块输入全卷积神经网络,输出256个路概率值小数,或是768个路,建筑,非路非建筑概率...
【专利技术属性】
技术研发人员:凌志辉,俞旸,徐中恒,
申请(专利权)人:南京云思创智信息科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。