识别文本的方法、装置、识别设备和存储介质制造方法及图纸

技术编号：28538381 阅读：46 留言：0更新日期：2021-05-21 09:02

本公开提供了一种识别文本的方法、装置、识别设备和存储介质，属于文本检测领域。所述方法包括：识别设备可以根据提取待识别图像的特征图，然后使用预设的分割网络和待识别图像，确定待识别图像的文本区域的分割信息，然后根据分割信息，确定文本区域的边界关键点，使用边界关键点，将文本区域中的文本转换为目标排列顺序的文本，将转换得到的文本输入到预设识别模型，进行识别处理。采用本公开，可以提升弯曲文本的识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
识别文本的方法、装置、识别设备和存储介质
本公开涉及文本检测领域，特别涉及一种识别文本的方法、装置、识别设备和存储介质。
技术介绍
OCR(OpticalCharacterRecognition，光学字符识别)技术作为一种重要的信息采集或录入的手段，可以代替人工输入，解放人力，从而被应用于多个场景。例如，可以应用于车牌识别、身份证信息识别、PDF(PortableDocumentFormat，便携式文档格式)文本解析等。一般的流程是先进行检测后进行识别，即先对传入的图像进行文本区域的检测，再针对于检测区域内进行文本识别。相关技术中，在对传入的图像进行文本区域检测时，得到的输出结果为一个四边形文本框(如矩形文本框或凸四边形框)，然后对矩形文本框或凸四边形框中的内容进行检测。由于在许多场景中均存在弯曲的文本，例如，发票章、广告牌等，所以仅使用四边形作为检测结果，这样，四边形中有可能不会包含弯曲文本，进而会导致弯曲文本的识别率比较低。
技术实现思路
为了解决弯曲文本的识别效率比较低的问题，本公开...

【技术保护点】
1.一种识别文本的方法，其特征在于，所述方法包括：/n根据预设的特征提取网络和待识别图像，提取所述待识别图像的特征图；/n根据所述预设的分割网络和所述特征图，确定所述待识别图像的文本区域的分割信息；/n根据所述分割信息，确定所述文本区域的边界关键点；/n根据所述边界关键点，将所述文本区域中的文本转换为目标排列顺序的文本；/n将转换得到的文本输入到预设识别模型，进行识别处理。/n

【技术特征摘要】
1.一种识别文本的方法，其特征在于，所述方法包括：
根据预设的特征提取网络和待识别图像，提取所述待识别图像的特征图；
根据所述预设的分割网络和所述特征图，确定所述待识别图像的文本区域的分割信息；
根据所述分割信息，确定所述文本区域的边界关键点；
根据所述边界关键点，将所述文本区域中的文本转换为目标排列顺序的文本；
将转换得到的文本输入到预设识别模型，进行识别处理。

2.根据权利要求1所述的方法，其特征在于，所述根据所述分割信息，确定所述文本区域的边界关键点，包括：
根据所述分割信息中第一边界区域中各像素点与所述第一边界区域的两个边界关键点之间的偏移，确定所述第一边界区域的两个边界关键点的位置信息；并根据所述分割信息中第二边界区域中各像素点与所述第二边界区域的两个边界关键点之间的偏移，确定所述第二边界区域的两个边界关键点的位置信息，其中，所述第一边界区域位于所述文本区域的头部，所述第二边界区域位于所述文本区域的尾部；
根据所述第一边界区域的两个边界关键点的位置信息和所述第二边界区域的两个边界关键点的位置信息，确定所述文本区域中除所述第一边界区域与所述第二边界区域的其它边界关键点。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：
确定所述文本区域中的文本的排布信息；
所述根据所述第一边界区域的两个边界关键点的位置信息和所述第二边界区域的两个边界关键点的位置信息，确定所述文本区域中除所述第一边界区域与所述第二边界区域的其它边界关键点，包括：
根据所述文本的排布信息、所述第一边界区域的两个边界关键点的位置信息和所述第二边界区域的两个边界关键点的位置信息，确定所述文本区域中除所述第一边界区域与所述第二边界区域的其它边界关键点。

4.根据权利要求3所述的方法，其特征在于，所述根据所述文本的排布信息、所述第一边界区域的两个边界关键点的位置信息和所述第二边界区域的两个边界关键点的位置信息，确定所述文本区域中除所述第一边界区域与所述第二边界区域的其它边界关键点，包括：
如果所述排布信息为横向排布，则根据所述第一边界区域中第一边界关键点的位置信息和所述第二边界区域中第二边界关键点的位置信息，确定所述文本区域的上边界除所述第一边界关键点和所述第二边界关键点之外的其它边界关键点，并根据所述第一边界区域中第四边界关键点的位置信息和所述第二边界区域中第三边界关键点的位置信息，确定所述文本区域的下边界除所述第三边界关键点和所述第三边界关键点之外的其它边界关键点；
如果所述排布信息为纵向排布，则根据所述第一边界区域中第一边界关键点的位置信息和所述第二边界区域中第二边界关键点的位置信息，确定所述文本区域的左边界除所述第一边界关键点和所述第二边界关键点之外的其它边界关键点，并根据所述第一边界区域中第四边界关键点的位置信息和所述第二边界区域中第三边界关键点的位置信息，确定所述文本区域的右边界除所述第三边界关键点和所述第四边界关键点之外的其它边界关键点。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一边界区域中第一边界关键点的位置信息和所述第二边界区域中第二边界关键点的位置信息，确定所述文本区域的左边界除所述第一边界关键点和所述第二边界关键点之外的其它边界关键点，包括：
根据所述第一边界区域中第一边界关键点的位置信息和所述第二边界区域中第二边界关键点的位置信息，确定第一预设数目个位置点的第一横坐标信息，其中，所述第一预设数目个位置点位于第一连线上，且是基于将所述第一连线等分为目标数值得到，所述目标数值等于所述第一预设数目加1，所述第一连线为所述第一边界关键点与所述第二边界关键点的连线；
根据所述第一横坐标信息，确定所述文本区域的上边界除所述第一边界关键点和所述第二边界关键点之外的其它边界关键点。

6.根据权利要求5所述的方法，其特征在于，所述分割信息包括所述文本区域中属于文本的像素点与所述文本区域的上边界的偏移；
所述根据所述第一横坐标信息，确定所述文本区域的上边界除所述第一边界关键点和所述第二边界关键点之外的其它边界关键点，包括：
对于所述第一预设数目个位置点中任一位置点的第一横坐标信息，根据所述位置点的第一横坐标信息对应的横坐标区间，确定所述文本区域中属于文本且横坐标位于所述横坐标区间的像素点；
将所述位置点的第一横坐标信息，确定为所述位置点对应的边界关键点的横坐标，并根据确定出的像素点与所述上边界的偏移，确定所述位置点对应的边界关键点的纵坐标，其中，所述位置点对应的边界关键点为位于所述文本区域的上边界，且所述上边界包括所述第一边界关键点和所述第二边界关键点。

7.根据权利要求4所述的方法，其特征在于，所述根据所述第一边界区域中第四边界关键点的位置信息和所述第二边界区域中第三边界关键点的位置信息，确定所述文本区域的下边界除所述第三边界关键点和所述第三边界关键点之外的其它边界关键点，包括：
根据所述第一边界区域中第四边界关键点的位置信息和所述第二边界区域中第三边界关键点的位置信息，确定第一预设数目个位置点的第二横坐标信息，其中，所述第一预设数目个位置点位于第二连线上，且是基于将所述第二连线等分为目标数值得到，所述目标数值等于所述第一预设数目加1，所述第二连线为所述第三边界关键点与所述...

【专利技术属性】
技术研发人员：乔梁，
申请(专利权)人：上海高德威智能交通系统有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人