图书封面检测方法、装置及存储介质和电子设备制造方法及图纸

技术编号:26172286 阅读:19 留言:0更新日期:2020-10-31 13:49
本发明专利技术提出图书封面检测方法、装置及存储介质和电子设备。方法包括:针对预设的图书图像采集区域,分别采集在该区域上分时且以不同姿态摆放的多本图书的图像,同时记录每本图书封面的四个顶点在所述区域内的坐标值;根据采集的每幅图像中的所有像素的颜色特征值以及该图像对应的图书封面的四个顶点在所述区域内的坐标值,建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型;当在预设的图书图像采集区域采集到一幅新图像时,将该新图像的所有像素的颜色特征值输入到建立的所述关联模型进行计算,得到该新图像对应的图书封面的四个顶点在所述区域内的坐标值。本发明专利技术实现了对图书封面的精确检测。

Book cover detection method, device, storage medium and electronic equipment

【技术实现步骤摘要】
图书封面检测方法、装置及存储介质和电子设备
本专利技术涉及图像检测
,尤其涉及图书封面检测方法、装置及非瞬时计算机可读存储介质和电子设备。
技术介绍
在图书仓库中,图书经过传送带运送到指定位置,在运送过程中,需要抓取图书。在图书自动识别系统中,需要先获取图书在背景中的准确位置,再对该图书封面进行识别,这样可以摆脱背景对图书封面的干扰,提高图书封面的检测率。现有的图书封面检测技术的步骤如下:1、获取图书的图像数据。2、将该图像数据输入计算机,利用检测算法提取图像特征。3、根据图像特征,获取目标的2点包围盒,即由左上角坐标与右下角坐标所确定的矩形区域,该矩形所包含区域即为算法检测结果。
技术实现思路
本专利技术提出图书封面检测方法、装置及非瞬时计算机可读存储介质和电子设备,以提高图书封面检测的精确度。本专利技术的技术方案是这样实现的:一种图书封面检测方法,该方法包括:针对预设的图书图像采集区域,分别采集在该区域上分时且以不同姿态摆放的多本图书的图像,同时记录每本图书封面的四个顶点在所述区域内的坐标值;根据采集的每幅图像中的所有像素的颜色特征值以及该图像对应的图书封面的四个顶点在所述区域内的坐标值,建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型;当在预设的图书图像采集区域采集到一幅新图像时,将该新图像的所有像素的颜色特征值输入到建立的所述关联模型进行计算,得到该新图像对应的图书封面的四个顶点在所述区域内的坐标值。所述建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型包括:分别将采集的各图书图像的所有像素的颜色特征值作为待训练的神经网络模型的输入值,将各图书封面的四个顶点在所述区域内的坐标值作为待训练神经网络模型的输出值,对待训练神经网络模型进行训练;当满足预设收敛条件时,停止训练,得到训练好的神经网络模型,该神经网络模型即所述关联模型。所述神经网络模型共5层:输入层、卷积层1、卷积层2、全连接层和输出层,其中,全连接层的输出通道数为8,每个通道分别对应图书封面的四个顶点的二维坐标中的一个坐标值。一种图书封面检测装置,该装置包括:采集及记录模块,针对预设的图书图像采集区域,分别采集在该区域上分时且以不同姿态摆放的多本图书的图像,同时记录每本图书封面的四个顶点在所述区域内的坐标值;关联模型建立模块,根据采集的每幅图像中的所有像素的颜色特征值以及该图像对应的图书封面的四个顶点在所述区域内的坐标值,建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型;图书封面顶点确定模块,当采集及记录模块在预设的图书图像采集区域采集到一幅新图像时,将该新图像的所有像素的颜色特征值输入到关联模型建立模块建立的所述关联模型进行计算,得到该新图像对应的图书封面的四个顶点在所述区域内的坐标值。所述关联模型建立模块用于:分别将采集的各图书图像的所有像素的颜色特征值作为待训练的神经网络模型的输入值,将各图书封面的四个顶点在所述区域内的坐标值作为待训练神经网络模型的输出值,对待训练神经网络模型进行训练;当满足预设收敛条件时,停止训练,得到训练好的神经网络模型,该神经网络模型即所述关联模型。所述关联模型建立模块采用的神经网络模型共5层:输入层、卷积层1、卷积层2、全连接层和输出层,其中,全连接层的输出通道数为8,每个通道分别对应图书封面的四个顶点的二维坐标中的一个坐标值。一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行如上任一项所述的图书封面检测方法的步骤。一种电子设备,包括如上所述的非瞬时计算机可读存储介质、以及可访问所述非瞬时计算机可读存储介质的所述处理器。本专利技术通过根据采集的每幅图像中的所有像素的颜色特征值以及该图像对应的图书封面的四个顶点在所述区域内的坐标值,建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型,当在预设的图书图像采集区域采集到一幅新图像时,将该新图像的所有像素的颜色特征值输入到建立的所述关联模型进行计算,得到该新图像对应的图书封面的四个顶点在所述区域内的坐标值,从而无论图书如何摆放都能准确检测出图书封面,提高了图书封面检测的精确度。附图说明图1为现有的图书封面检测的示例图;图2为本专利技术一实施例提供的图书封面检测方法流程图;图3为本专利技术另一实施例提供的图书封面检测方法流程图;图4为本专利技术实施例提供的图书封面检测装置的结构示意图。具体实施方式下面结合附图及具体实施例对本专利技术再作进一步详细的说明。现有的图书封面检测技术,对于倾斜放置的图书检测效果较差,如图1所示,矩形所包围的区域为检测结果,该检测结果中仍然包含大量背景,并没有完全准确地提取图书位置。专利技术人经过分析后认为:现有的图书封面检测技术造成上述问题的原因是,只获得了目标的2点包围盒。图2为本专利技术一实施例提供的图书封面检测方法流程图,其具体步骤如下:步骤201:针对预设的图书图像采集区域,分别采集在该区域上分时且以不同姿态摆放的多本图书的图像,同时记录每本图书封面的四个顶点在所述区域内的坐标值。步骤202:根据采集的每幅图像中的所有像素的颜色特征值以及该图像对应的图书封面的四个顶点在所述区域内的坐标值,建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型。步骤203:当在预设的图书图像采集区域采集到一幅新图像时,将该新图像的所有像素的颜色特征值输入到建立的所述关联模型进行计算,得到该新图像对应的图书封面的四个顶点在所述区域内的坐标值。即本专利技术实施例最终得到的是图书封面的四点包围盒,显然相对于2点包围盒,本专利技术实施例无论图书如何摆放,都能准确定位出封面的位置。图3为本专利技术另一实施例提供的图书封面检测方法流程图,其具体步骤如下:步骤301:预先采集预设图书图像采集区域内分时且以各种姿态摆放的不同图书样本的图像,并记录各图书样本的四个顶点在图书图像采集区域内的坐标值。图书图像采集区域即图书的摆放区域,由于用户摆放图书的随意性,该区域要尽可能覆盖所有图书的摆放范围。例如:当对传送带上传送的一本本图书的封面进行检测时,就将传送带的某一传送位置作为图书图像采集区域,实时对该区域进行图像采集,这样,当每一图书传送到该位置时,就可采集到该图书的图像。在实际应用中,可预先选取不同封面的多本图书样本,并将每本图书样本在图书图像采集区域以不同姿态摆放。为了提高神经网络模型的精度,在选取图书样本时,要尽可能地覆盖更多类型的封面。可在图书图像采集区域所在平面内建立二维坐标系,将指定点(如:区域的左上角或者区域的中心等)作为原点,经过原点且相互垂直的两个本文档来自技高网...

【技术保护点】
1.一种图书封面检测方法,其特征在于,该方法包括:/n针对预设的图书图像采集区域,分别采集在该区域上分时且以不同姿态摆放的多本图书的图像,同时记录每本图书封面的四个顶点在所述区域内的坐标值;/n根据采集的每幅图像中的所有像素的颜色特征值以及该图像对应的图书封面的四个顶点在所述区域内的坐标值,建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型;/n当在预设的图书图像采集区域采集到一幅新图像时,将该新图像的所有像素的颜色特征值输入到建立的所述关联模型进行计算,得到该新图像对应的图书封面的四个顶点在所述区域内的坐标值。/n

【技术特征摘要】
1.一种图书封面检测方法,其特征在于,该方法包括:
针对预设的图书图像采集区域,分别采集在该区域上分时且以不同姿态摆放的多本图书的图像,同时记录每本图书封面的四个顶点在所述区域内的坐标值;
根据采集的每幅图像中的所有像素的颜色特征值以及该图像对应的图书封面的四个顶点在所述区域内的坐标值,建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型;
当在预设的图书图像采集区域采集到一幅新图像时,将该新图像的所有像素的颜色特征值输入到建立的所述关联模型进行计算,得到该新图像对应的图书封面的四个顶点在所述区域内的坐标值。


2.根据权利要求1所述的方法,其特征在于,所述建立图像的所有像素的颜色特征值与图书封面的四个顶点在所述区域内的坐标值之间的关联模型包括:
分别将采集的各图书图像的所有像素的颜色特征值作为待训练的神经网络模型的输入值,将各图书封面的四个顶点在所述区域内的坐标值作为待训练神经网络模型的输出值,对待训练神经网络模型进行训练;
当满足预设收敛条件时,停止训练,得到训练好的神经网络模型,该神经网络模型即所述关联模型。


3.根据权利要求1所述的方法,其特征在于,所述神经网络模型共5层:输入层、卷积层1、卷积层2、全连接层和输出层,其中,全连接层的输出通道数为8,每个通道分别对应图书封面的四个顶点的二维坐标中的一个坐标值。


4.一种图书封面检测装置,其特征在于,该装置包括:
采集及记录模块,针对预设的图书图像采集区域,分别采集在该区域上分时且以不同姿态摆放的多本图书的图像,同时记录每本图书封面的四...

【专利技术属性】
技术研发人员:白宇林金表
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1