一种图像数据检测方法、装置以及计算机可读存储介质制造方法及图纸

技术编号：24093333 阅读：46 留言：0更新日期：2020-05-09 09:05

本申请公开了一种图像数据检测方法、装置以及计算机可读存储介质，该方法包括：获取检测图像，从检测图像中获取包含目标对象的情景图像；获取情景图像中的像素点对应的位置特征矩阵；位置特征矩阵中包括像素点针对目标对象的位置特征元素；根据情景图像中的目标对象的对象排版特征，生成用于调整位置特征矩阵中的位置特征元素的注意力机制矩阵；根据位置特征矩阵中的位置特征元素和注意力机制矩阵，确定像素点对应的预测区域，将像素点对应的预测区域添加至预测区域集合；在预测区域集合中，选择与目标对象在检测图像中的对象位置和对象尺寸相匹配的预测区域，作为目标区域。采用本申请，可提高针对目标对象的检测准确性。

An image data detection method, device and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种图像数据检测方法、装置以及计算机可读存储介质
本申请涉及数据检测的
，尤其涉及一种图像数据检测方法、装置以及计算机可读存储介质。
技术介绍
随着计算机网络的不断发展，对于物体检测的相关技术也日趋成熟，检测的物体可以是想要进行检测的任意物体，例如，针对人脸的检测以及针对文字的检测等。在一种检测场景中，若是需要通过对某个书籍的封面图像进行智能识别以得到该封面图像所对应的书籍名称、书籍作者以及书籍出版社等信息，则首先就需要对该封面图像中的文字位置进行检测，只有在检测到该封面图像中的文字具体所在的位置，才能进一步地对所检测到的文字进行识别，即识别出所检测到的文字的具体内容。但是，现有技术中，若封面图像中的文字组过于密集，则会导致文字组容易被粘连，例如，若书籍名称对应的文字组和书籍作者对应的文字组之间的间距太小，则会将书籍名称对应的文字组和书籍作者对应的文字组检测为一个文字组。若封面图像的文字组中的文字过于稀疏，则会导致文字组容易被截断，例如，若书籍名称对应的文字组中的多个文字之间的间距太大，则会将书籍名称对应的文字组检测为多个文字组。由此可知，现有技术中，针对图像中的文字组的具体位置的检测结果并不准确。申请内容本申请提供了一种图像数据检测方法、装置以及计算机可读存储介质，可提高针对目标对象的检测准确性。本申请一方面提供了一种图像数据检测方法，包括：获取检测图像，从检测图像中获取包含目标对象的情景图像；获取情景图像中的像素点对应的位置特征矩阵；位置特征矩阵中包括...

【技术保护点】
1.一种图像数据检测方法，其特征在于，包括：/n获取检测图像，从所述检测图像中获取包含目标对象的情景图像；/n获取所述情景图像中的像素点对应的位置特征矩阵；所述位置特征矩阵包括所述像素点针对所述目标对象的位置特征元素；/n根据所述情景图像中的所述目标对象的对象排版特征，生成用于调整所述位置特征矩阵中的所述位置特征元素的注意力机制矩阵；/n根据所述位置特征矩阵中的所述位置特征元素和所述注意力机制矩阵，确定所述像素点对应的预测区域，将所述像素点对应的预测区域添加至预测区域集合；/n在所述预测区域集合中，选择与所述目标对象在所述检测图像中的对象位置和对象尺寸相匹配的预测区域，作为目标区域。/n

【技术特征摘要】
1.一种图像数据检测方法，其特征在于，包括：
获取检测图像，从所述检测图像中获取包含目标对象的情景图像；
获取所述情景图像中的像素点对应的位置特征矩阵；所述位置特征矩阵包括所述像素点针对所述目标对象的位置特征元素；
根据所述情景图像中的所述目标对象的对象排版特征，生成用于调整所述位置特征矩阵中的所述位置特征元素的注意力机制矩阵；
根据所述位置特征矩阵中的所述位置特征元素和所述注意力机制矩阵，确定所述像素点对应的预测区域，将所述像素点对应的预测区域添加至预测区域集合；
在所述预测区域集合中，选择与所述目标对象在所述检测图像中的对象位置和对象尺寸相匹配的预测区域，作为目标区域。

2.根据权利要求1所述的方法，其特征在于，所述位置特征矩阵包括水平位置特征矩阵和垂直位置特征矩阵；所述位置特征元素包括所述像素点针对所对应的目标对象的水平边缘距离元素和垂直边缘距离元素；所述水平位置特征矩阵中的位置特征元素为所述水平边缘距离元素；所述垂直位置特征矩阵中的位置特征元素为所述垂直边缘距离元素；所述注意力机制矩阵包括水平注意力机制矩阵和垂直注意力机制矩阵；所述水平注意力机制矩阵用于调整所述水平位置特征矩阵中的水平边缘距离元素；所述垂直注意力机制矩阵用于调整所述垂直位置特征矩阵中的垂直边缘距离元素。

3.根据权利要求2所述的方法，其特征在于，所述根据所述位置特征矩阵中的所述位置特征元素和所述注意力机制矩阵，确定所述像素点对应的预测区域，包括：
基于所述水平注意力机制矩阵对所述水平位置特征矩阵中的水平边缘距离元素进行加权运算，得到加权后的水平位置特征矩阵；
基于所述垂直注意力机制矩阵对所述垂直位置特征矩阵中的垂直边缘距离元素进行加权运算，得到加权后的垂直位置特征矩阵；
根据所述加权后的水平位置特征矩阵和所述加权后的垂直位置特征矩阵，确定所述像素点对应的预测区域。

4.根据权利要求3所述的方法，其特征在于，所述位置特征矩阵还包括角度特征矩阵；
所述根据所述加权后的水平位置特征矩阵和所述加权后的垂直位置特征矩阵，确定所述像素点对应的预测区域，包括：
根据所述加权后的水平位置特征矩阵和所述加权后的垂直位置特征矩阵，确定所述像素点对应的预测区域的区域尺寸；
根据所述角度特征矩阵和所述像素点在所述检测图像中的像素位置坐标，确定所述像素点对应的预测区域在所述检测图像中的区域位置；
根据所述像素点对应的所述区域尺寸和所述区域位置，确定所述像素点对应的预测区域。

5.根据权利要求1所述的方法，其特征在于，所述在所述预测区域集合中，选择与所述目标对象在所述检测图像中的对象位置和对象尺寸相匹配的预测区域，作为目标区域，包括：
获取所述预测区域集合中的每个预测区域分别对应的置信度；所述置信度用于表征所对应的预测区域为所述目标区域的概率；
将所述预测区域集合中所述置信度小于置信度阈值的预测区域，从所述预测区域集合中删除，得到第一过滤区域集合；
从所述第一过滤区域集合中，获取所述目标区域。

6.根据权利要求5所述的方法，其特征在于，所述第一过滤区域集合包括第一预测区域和第二预测区域；
所述从所述第一过滤区域集合中，获取所述目标区域，包括：
获取所述第一预测区域和所述第二预测区域在所述检测图像中的区域重合比例；
当所述区域重合比例大于区域重合比例阈值，且所述第一预测区域对应的置信度大于所述第二预测区域对应的置信度时，将所述第二预测区域从所述第一过滤区域集合中删除，得到第二过滤区域集合；
将所述第二过滤区域集合中的预测区域，均确定为所述目标区域。

7.一种图像数据检测方法，其特征在于，包括：
原始检测模型获取训练图像，从所述训练图像中获取包含目标对象的情景图像；
获取所述情景图像中的像素点对应的位置特征矩阵；所述位置特征矩阵中包括所述像素点针对所述目标对象的位置特征元素；
根据所述情景图像中的所述目标对象的对象排版特征，生成用于调整所述位置特征矩阵中的所述位置特征元素的注意力机制矩阵；
根据所述位置特征矩阵中的所述位置特征元素和所述注意力机制矩阵，确定所述像素点对应的预测区域，将所述像素点对应的预测区域添加至预测区域集合；
从所述预测区域集合中，选择与所述目标对象在所述检测图像中的对象位置和对象尺寸相匹配的预测区域，作为目标区域；
根据所述目标区域与在所述训练图像中所标记的所述目标对象的实际所在区域之间的区域差异，修正所述原始检测模型的模型参数，得到检测模型。

8.根据权利要求7所述的方法，其特征在于，所述获取所述情景图像中的像素点对应的位置特征矩阵，包括：
识别所述情景图像中的像素点的像素点类型，根据识别结果为所述...

【专利技术属性】
技术研发人员：刘畅，殷绪成，王红法，郭春超，吴隆煌，
申请(专利权)人：北京科技大学，腾讯科技深圳有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人