视频图像检测方法和装置制造方法及图纸

技术编号:18554265 阅读:29 留言:0更新日期:2018-07-28 11:09
本申请公开了一种图像检测方法和装置,其中方法包括:输入步骤:将第一图像输入经过训练的神经网络;检测步骤:基于所述神经网络对所述第一图像中感兴趣区域进行检测,得到围绕所述感兴趣区域的多边形,检测所述多边形的各个边所在的直线;输出步骤:输出描述所述各个边所在的直线的参数。本申请采用线性标识方式对图像中的感兴趣区域进行了标识,与传统的标识方法相比,大大减小了神经网络的训练量和识别运算量。

【技术实现步骤摘要】
视频图像检测方法和装置
本申请涉及图像处理领域,特别是涉及视频图像检测方法和装置。
技术介绍
目前,在视频,例如电影、电视剧中植入广告已经屡见不鲜。其中,在视频画面中植入平面图案广告是植入广告的方式之一。通常,在视频中检测平面的方法是通过识别视频帧中的平面并利用坐标矩阵对平面进行标识,根据相邻帧中坐标矩阵的变化计算计算透视变换矩阵,从而检测到视频中平面存在的位置坐标。然而该方法数据计算量大,导致计算速度慢,识别效率低。
技术实现思路
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。根据本申请的一个方面,提供了一种图像检测方法,包括:输入步骤:将第一图像输入经过训练的神经网络;检测步骤:基于所述神经网络对所述第一图像中感兴趣区域进行检测,得到围绕所述感兴趣区域的多边形,检测所述多边形的各个边所在的直线;输出步骤:输出描述所述各个边所在的直线的参数。本申请采用线性标识方式对图像中的感兴趣区域进行了标识,与传统的标识方法相比,大大减小了神经网络的训练量和识别运算量。可选地,所述经过训练的神经网络模型采用以下步骤获得:训练数据集获取步骤:对多个第二图像的感兴趣区域进行标识,得到训练数据集;SSD网络训练步骤:利用所述训练数据集训练SSD网络;神经网络训练步骤:利用所述训练数据集训练神经网络,其中,所述神经网络通过如下方式获得:将训练后的所述SSD网络的检测(Detection)层的输入作为LSTM网络(长短期记忆神经网络)的输入,从而将所述SSD网络与所述LSTM网络组合形成所述神经网络。本申请采用SSD+LSTM的神经网络方式,极大增强了对视频内容的人工智能处理能力。可选地,所述神经网络训练步骤后还包括:神经网络测试步骤:若所述神经网络训练步骤得到的所述神经网络不能达到预期效果,则重复所述SSD网络训练步骤;若所述神经网络训练步骤得到的所述神经网络能够达到预期效果,则在有新的训练数据时,利用所述新的训练数据训练所述神经网络。可选地,在所述输入步骤前,该方法还包括:视频帧调整步骤:将视频中的每一帧缩小到一定的尺寸,得到第一图像集合,将所述第一图像集合中的每一个第一图像,按照所述视频播放的顺序依次执行所述输入步骤。可选地,在所述输出步骤后,该方法还包括:直线参数转化步骤:将所述输出步骤输出的所述直线的参数转化为矩阵,所述矩阵用于描述所述多边形内各个像素点的位置。本申请将直线参数转化为矩阵形式,为后续其他的处理方式提供另一种类型的数据形式,便于对多边形内的图像作进一步的分析。可选地,所述感兴趣区域为平面。可选地,所述多边形为四边形。可选地,所述直线的参数为直线方程y=kx+b的斜率k和截距b。可选地,所述直线的参数为直线方程Ax+By+C=0中的系数A、B和C。根据本申请的另一个方面,提供了一种图像检测装置,包括:输入装置,被配置成将第一图像输入经过训练的神经网络;检测装置,被配置成基于所述神经网络对所述第一图像中感兴趣区域进行检测,得到围绕所述感兴趣区域的多边形,检测所述多边形的各个边所在的直线;输出装置,被配置成输出描述所述各个边所在的直线的参数。本申请采用线性标识方式对图像中的感兴趣区域进行了标识,与传统的标识方法相比,大大减小了神经网络的训练量和识别运算量。可选地,所述经过训练的神经网络模型采用以下模块获得:训练数据集获取装置,被配置成对多个第二图像的感兴趣区域进行标识,得到训练数据集;SSD网络训练装置,被配置成利用所述训练数据集训练SSD网络;神经网络训练装置,被配置成利用所述训练数据集训练神经网络,其中,所述神经网络通过如下方式获得:将训练后的所述SSD网络的检测(Detection)层的输入作为LSTM网络的输入,从而将所述SSD网络与所述LSTM网络组合形成所述神经网络。可选地,所述神经网络训练装置后还包括:神经网络测试装置,被配置成若所述神经网络训练装置得到的所述神经网络不能达到预期效果,则返回所述SSD网络训练装置;若所述神经网络训练装置得到的所述神经网络能够达到预期效果,则在有新的训练数据时,利用所述新的训练数据训练所述神经网络。可选地,所述输入装置前还包括:视频帧调整装置,被配置成将视频中的每一帧缩小到一定的尺寸,得到第一图像集合,将所述第一图像集合中的每一个第一图像,按照所述视频播放的顺序依次执行所述输入步骤。可选地,所述输出装置后还包括:直线参数转化装置,被配置成将所述输出装置输出的所述直线的参数转化为矩阵,所述矩阵用于描述所述多边形内各个像素点的位置。可选地,所述感兴趣区域为平面。可选地,所述多边形为四边形。可选地,所述直线的参数为直线方程y=kx+b的斜率k和截距b。可选地,所述直线的参数为直线方程Ax+By+C=0中的系数A、B和C。根据本申请的另一个方面,还提供了一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述的方法。根据本申请的另一个方面,还提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述的方法。根据本申请的另一个方面,还提供了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述的方法。根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。附图说明后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:图1是根据本申请的图像检测方法的一个实施例的流程图;图2是根据本申请的神经网络模型获得步骤的一个实施例的流程图;图3是根据本申请的图像检测方法的另一个实施例的流程图;图4是根据本申请的图像检测装置的一个实施例的框图;图5是根据本申请的神经网络模型训练装置的一个实施例的框图。具体实施方式根据本申请的一个方面,提供了一种图像检测方法,参见图1,该方法包括:S1输入步骤:将第一图像输入经过训练的神经网络。该方法还包括检测步骤:基于所述神经网络对所述第一图像中感兴趣区域进行检测,得到围绕所述感兴趣区域的多边形,检测所述多边形的各个边所在的直线。该方法还包括输出步骤:输出描述所述各个边所在的直线的参数。本申请采用线性标识方式对图像中的感兴趣区域进行了标识,与传统的标识方法相比,大大减小了神经网络的训练量和识别运算量。可选地,参见图2,S1中所述经过训练的神经网络模型采用以下步骤获得:S11,训练数据集获取步骤:对多个第二图像的感兴趣区域进行标识,得到训练数据集。其中,第二图像可以为现有的训练数据集中的图像,例如,PASCALVOC、MSCOCO、ILSVRC数据集等,也可以是视频中存在感兴趣区域的帧组成的数据集。S12,SSD网络训练步骤:利用所述训练数据集训练SSD网络。SSD是一种基于全卷积的网络的检测器,该算法使用单个的卷积神经网络对图像进行卷积后,在特征图像的每一个位置处预测一系列不同尺寸和长宽比的边界框。图2给出了SSD网络的结构示意图。SSD网络包括数据层、特征提本文档来自技高网...

【技术保护点】
1.一种图像检测方法,包括:输入步骤:将第一图像输入经过训练的神经网络;检测步骤:基于所述神经网络对所述第一图像中感兴趣区域进行检测,得到围绕所述感兴趣区域的多边形,检测所述多边形的各个边所在的直线;输出步骤:输出描述所述各个边所在的直线的参数。

【技术特征摘要】
1.一种图像检测方法,包括:输入步骤:将第一图像输入经过训练的神经网络;检测步骤:基于所述神经网络对所述第一图像中感兴趣区域进行检测,得到围绕所述感兴趣区域的多边形,检测所述多边形的各个边所在的直线;输出步骤:输出描述所述各个边所在的直线的参数。2.根据权利要求1所述的方法,其特征在于,所述经过训练的神经网络模型采用以下步骤获得:训练数据集获取步骤:对多个第二图像的感兴趣区域进行标识,得到训练数据集;SSD网络训练步骤:利用所述训练数据集训练SSD网络;神经网络训练步骤:利用所述训练数据集训练神经网络,其中,所述神经网络通过如下方式获得:将训练后的所述SSD网络的检测(Detection)层的输入作为LSTM网络的输入,从而将所述SSD网络与所述LSTM网络组合形成所述神经网络。3.根据权利要求2所述的方法,其特征在于,所述神经网络训练步骤后还包括:神经网络测试步骤:若所述神经网络训练步骤得到的所述神经网络不能达到预期效果,则重复所述SSD网络训练步骤;若所述神经网络训练步骤得到的所述神经网络能够达到预期效果,则在有新的训练数据时,利用所述新的训练数据训练所述神经网络。4.根据权利要求1所述的方法,其特征在于,在所述输入步骤前,该方法还包括:视频帧调整步骤:将视频中的每一帧缩小到一定的尺寸,得到第一图像集合,将所述第一图像集合中的每一个第一图像,按照所述视频播放的顺序依次执行所述输入步骤。5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述输出步骤后,该方法还包括:直线参...

【专利技术属性】
技术研发人员:宋旭博
申请(专利权)人:北京影谱科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1