【技术实现步骤摘要】
目标检测与图像识别方法和设备、计算机可读介质
本申请涉及图像处理领域,尤其涉及用于人工智能的图像处理领域。本申请具体涉及目标检测与图像识别方法和设备、计算机可读介质。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)技术是图像处理与人工智能技术中一个重要的
,其主要用于解决自然场景中的图像(文本)检测和识别。目前的目标检测尤其是文本检测中,针对密集文本和长文本,主要采用先进行图像分割、然后进行边界框预测和回归的方法。
技术实现思路
本申请提供了目标检测与图像识别方法和设备、计算机可读介质。根据本申请的一方面,提供一种目标检测方法,包括:通过分类和预测模型,获得输入图像的预测像素点、以及由预测像素点的标签得分构成的标签得分图;通过边界框回归,得到和预测像素点与初步预测边界框之间的位置关系有关的预测参数作为位置相关参数,其中,所述初步预测边界框基于所述预测像素点中位于边界的预测像素点而形成;基于预测像素点的至少一部分所述位置 ...
【技术保护点】
1.一种目标检测方法,包括:/n通过分类和预测模型,获得输入图像的预测像素点、以及由预测像素点的标签得分构成的标签得分图;/n通过边界框回归,得到和预测像素点与初步预测边界框之间的位置关系有关的预测参数,作为位置相关参数,其中,所述初步预测边界框基于所述预测像素点中位于边界的预测像素点而形成;/n基于预测像素点的至少一部分所述位置相关参数,计算该预测像素点的位置得分;/n基于预测像素点的标签得分与位置得分,计算该预测像素点的置信度;以及/n基于通过所述置信度而确定的可信的预测像素点,确定输入图像的目标框。/n
【技术特征摘要】
1.一种目标检测方法,包括:
通过分类和预测模型,获得输入图像的预测像素点、以及由预测像素点的标签得分构成的标签得分图;
通过边界框回归,得到和预测像素点与初步预测边界框之间的位置关系有关的预测参数,作为位置相关参数,其中,所述初步预测边界框基于所述预测像素点中位于边界的预测像素点而形成;
基于预测像素点的至少一部分所述位置相关参数,计算该预测像素点的位置得分;
基于预测像素点的标签得分与位置得分,计算该预测像素点的置信度;以及
基于通过所述置信度而确定的可信的预测像素点,确定输入图像的目标框。
2.根据权利要求1所述的方法,其中,所述位置关系包括距离关系和/或角度关系。
3.根据权利要求1所述的方法,其中,所述位置相关参数包括预测像素点与所述初步预测边界框的边的相对距离参数和/或角度参数。
4.根据权利要求1所述的方法,其中,所述位置相关参数包括预测像素点到所述初步预测边界框左侧边的相对距离LL、到所述初步预测边界框右侧边的相对距离RL、到所述初步预测边界框上侧边的相对距离TL、到所述初步预测边界框下侧边的相对距离BL、和/或预测角度TT,其中,所述预测角度TT为该预测像素点到所述初步预测边界框的纵向边的垂线与X轴形成的角度或者该预测像素点到所述初步预测边界框的横向边的垂线与Y轴形成的角度。
5.根据权利要求3所述的方法,其中,所述基于预测像素点的至少一部分所述位置相关参数,计算该预测像素点的位置得分包括:
通过比较该预测像素点的所述相对距离参数与所述初步预测边界框的边长来获得该预测像素点的位置得分。
6.根据权利要求4所述的方法,其中,所述基于预测像素点的至少一部分所述位置相关参数,计算该预测像素点的位置得分包括:
通过分别比较预测像素点到所述初步预测边界框的纵向边的横向相对距离与所述初步预测边界框的横向边长、该预测像素点到所述初步预测边界框的横向边的纵向相对距离与所述初步预测边界框的纵向边长来获得该预测像素点的横向位置得分和纵向位置得分。
7.根据权利要求4所述的方法,其中,所述基于各预测像素点的至少一部分所述位置相关参数,计算该预测像素点的位置得分包括:
通过分别比较预测像素点到所述初步预测边界框的纵向边的横向相对距离中的最小值与所述横向相对距离中的最大值、该预测像素点到所述初步预测边界框的横向边的纵向相对距离中的最小值与所述纵向相对距离中的最大值来获得该预测像素点的横向位置得分和纵向位置得分。
8.根据权利要求1所述的方法,其中,所述基于预测像素点的标签得分与位置得分,计算该预测像素点的置信度包括:
将该预测像素点的位置得分与标签得分相乘,得到该预测像素点的置信度。
9.根据权利要求6或7所述的方法,其中,所述基于预测像素点的标签得分与位置得分,计算该预测像素点的置信度包括:
将该预测像素点的横向位置得分与纵向位置得分的均值与该预测像素点的标签得分相乘,得到该预测像素点的置信度。
10.根据权利要求6或7所述的方法,其中,所述基于预测像素点的标签得分与位置得分,计算该预测像素点的置信度包括:
将该预测像素点的横向位置得分的平方与纵向位置得分的平方的均值与该预测像素点的标签得分相乘,得到该预测像素点的置信度。
11.一种目标检测装置,包括:
标签得分图获得单元,被配置用于通过分类和预测模型,获得输入图像的各预测像素点以及由各预测像素点的标签得分构成的标签得分图;
位置相关参数获得单元,被配置用于通过边界框回归,得到和每个预测像素点与初步预测...
【专利技术属性】
技术研发人员:张子浩,李兵,杨家博,
申请(专利权)人:北京易真学思教育科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。