文本检测的方法、装置、设备和计算机可读介质制造方法及图纸

技术编号：26223291 阅读：41 留言：0更新日期：2020-11-04 10:55

本发明专利技术公开了文本检测的方法、装置、设备和计算机可读介质，涉及计算机技术领域。该方法的一具体实施方式包括：通过卷积神经网络提取输入图像多个尺寸的特征，并融合所述多个尺寸的特征得到特征图像；在所述特征图像中定位文字待选区域，以及所述文字待选区域的起点和所述文字待选区域的终点；依据所述文字待选区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框，以在所述文本框内检测文本。该实施方式能够提高文本检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
文本检测的方法、装置、设备和计算机可读介质
本专利技术涉及计算机
，尤其涉及一种文本检测的方法、装置、设备和计算机可读介质。
技术介绍
随着计算机视觉与深度神经网络的发展，文本检测技术得到了极大的发展。文本检测技术不仅可用于身份证等证件类的检测，在金融票据和保险单据的检测中也具有广泛的应用前景。在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：在实际应用中，由于图像的采集、处理和传输等环节存在图像失真问题，光学字符识别技术对图像质量要求较高，因此导致文本检测的准确率较低。
技术实现思路
有鉴于此，本专利技术实施例提供一种文本检测的方法、装置、设备和计算机可读介质，能够提高文本检测的准确率。为实现上述目的，根据本专利技术实施例的一个方面，提供了一种文本检测的方法，包括：通过卷积神经网络提取输入图像多个尺寸的特征，并融合所述多个尺寸的特征得到特征图像；在所述特征图像中定位文字待选区域，以及所述文字待选区域的起点和所述文字待选区域的终点；依据所述文字待选区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框，以在所述文本框内检测文本。所述在所述特征图像中定位文字待选区域，以及所述文字待选区域的起点和所述文字待选区域的终点，包括：按照所述特征图像中每个像素点属于文字的概率，定位文字待选区域；将所述文字待选区域的左上角区域内的像素点作为起点，以及将所述文字待选区域的右下角区域内的像素点作为终点。所述依据所...

【技术保护点】
1.一种文本检测的方法，其特征在于，包括：/n通过卷积神经网络提取输入图像多个尺寸的特征，并融合所述多个尺寸的特征得到特征图像；/n在所述特征图像中定位文字待选区域，以及所述文字待选区域的起点和所述文字待选区域的终点；/n依据所述文字待选区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框，以在所述文本框内检测文本。/n

【技术特征摘要】
1.一种文本检测的方法，其特征在于，包括：
通过卷积神经网络提取输入图像多个尺寸的特征，并融合所述多个尺寸的特征得到特征图像；
在所述特征图像中定位文字待选区域，以及所述文字待选区域的起点和所述文字待选区域的终点；
依据所述文字待选区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框，以在所述文本框内检测文本。

2.根据权利要求1所述文本检测的方法，其特征在于，所述在所述特征图像中定位文字待选区域，以及所述文字待选区域的起点和所述文字待选区域的终点，包括：
按照所述特征图像中每个像素点属于文字的概率，定位文字待选区域；
将所述文字待选区域的左上角区域内的像素点作为起点，以及将所述文字待选区域的右下角区域内的像素点作为终点。

3.根据权利要求1或2所述文本检测的方法，其特征在于，所述依据所述文字待选区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框，包括：
依据所述文字待选区域中相邻像素点的聚类结果，将所述文字待选区域划分为一个或多个文字区域；
依据所述文字区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框。

4.根据权利要求3所述文本检测的方法，其特征在于，所述依据所述文字区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框，包括：
所述文字区域包括一对所述文字待选区域的起点和所述文字待选区域的终点，则将所述文字待选区域的起点作为文本框的起点，并将所述文字待选区域的终点作为文本框的终点，以确定所述文本框。

5.根据权利要求3所述文本检测的方法，其特征在于，所述依据所述文字区域、所述文字待选区域的起点和所述文字待选区域的终点，确定文本框，包括：
所述文字区域包括多对所述文字待选区域的起点和所述文字待选区域的终点，则将最短距离对应的所述文字待选区域的起点作为文本框的起点，以及将所述最短距离对应的所述文...

【专利技术属性】
技术研发人员：张秋晖，刘岩，
申请(专利权)人：泰康保险集团股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人