一种文本识别方法和装置制造方法及图纸

技术编号:25043996 阅读:19 留言:0更新日期:2020-07-29 05:34
本申请公开了一种文本识别方法、装置及存储介质,本申请文本识别装置获取包含目标文本的待识别图像;根据预置的文本识别网络模型以及预置的特征词从待识别图像中确定特征文本区域;再根据训练后的文本提取网络模型从特征文本区域中提取文本信息,文本提取网络模型由四个CNN模块、一个RNN模块以及一个CTC模块组成;最后根据文本信息确定目标文本。该方案从待识别图像中提取(剪切)与特征词相关的文本区域,再根据文本提取网络模型从提取出的特征文本区域中提取文本信息,然后从文本信息中识别出目标文本,故该方案可以自动从图像中识别出目标文本,且只提取与特征词相关的文本区域的文本信息可以降低无关文本的干扰程度,识别准确率高。

【技术实现步骤摘要】
一种文本识别方法和装置
本申请涉及图像识别领域,具体涉及一种文本识别方法和装置。
技术介绍
自然场景图像指的是图片中除了含有文字之外还含有其他掺杂场景的图像,从自然场景图像中提取指定类型的文本难度很大。例如,在现在的地图系统里,往往需要提供小区内部各个单元楼栋门牌号信息来满足实际的使用需求,对于快递业务来说,如果电子地图能够提供楼栋号的高精度定位,可以大大节省人力的损耗,加快投递速度。但是由于从自然场景图像中提取门牌文本信息(提取指定类型的文本)难度很大,故构建此类地图往往需要采用人员从含有门牌文本信息的自然场景图片中手工采集门牌文本信息,或实地到访手工采集门牌文本信息。
技术实现思路
本申请实施例提供一种文本识别方法、装置,用于从图像中自动获取目标文本。一方面,本申请提供一种文本识别方法,所述方法包括:获取包含目标文本的待识别图像;根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成;根据所述文本信息确定所述目标文本。可选的,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域,包括:根据所述文本识别网络模型从所述待识别图像中确定文本区域;根据所述特征词从所述文本区域中确定所述特征文本区域。可选的,所述根据所述文本信息确定所述目标文本,包括:将所述文本信息映射到训练后的高维空间模型中,得到所述特征词与多个子文本的词距;将词距最小的子文本确定为所述目标文本。可选的,所述将所述文本信息映射到训练后的高维空间模型中之前,所述方法还包括:根据训练样本训练所述高维空间模型,所述训练样本为已知词距的样本。可选的,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域之前,所述方法还包括:根据预置的角度检测模型检测所述待识别图像,得到所述待检测图像的倾斜角度;根据所述倾斜角度对所述待识别图像进行角度调整,得到调整后的待识别图像;所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域,包括:根据预置的文本识别网络模型以及预置的特征词从所述调整后的待识别图像中确定特征文本区域。可选的,所述根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息之前,所述方法还包括:构建所述文本提取网络模型,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成。根据CTC损失值对所述文本提取网络模型进行训练,得到所述训练后的文本提取网络模型。可选的,所述CNN模块由卷积层、第一BN层、第一rulu层以及最大池化层组成,所述RNN模块由flatten层、第一全连接层、第二BN层、第二rulu层、dropout层、第一双向RNN层、第二全连接层、第二双向RNN层、第三全连接层以及softmax层组成。可选的,所述将所述文本信息中与所述特征词的词距最近的子文本确定为目标文本之后,所述方法还包括:提取所述目标文本。可选的,所述目标文本为门牌文本信息。一方面,本申请还提供一种文本识别装置,包括:获取单元,用于获取包含目标文本的待识别图像;第一确定单元,用于根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;第一提取单元,用于根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息;第二确定单元,用于将所述文本信息中与所述特征词的词距最近的子文本确定为所述目标文本。可选的,所述第一确定单元具体用于:根据所述文本识别网络模型从所述待识别图像中确定文本区域;根据所述特征词从所述文本区域中确定所述特征文本区域。可选的,所述第二确定单元具体用于:将所述文本信息映射到训练后的高维空间模型中,得到所述特征词与多个子文本的词距;将词距最小的子文本确定为所述目标文本。可选的,所述装置还包括:第一训练单元,用于根据训练样本训练所述高维空间模型,所述训练样本为已知词距的样本。可选的,所述装置还包括:检测单元,用于根据预置的角度检测模型检测所述待识别图像,得到所述待检测图像的倾斜角度;调整单元,用于根据所述倾斜角度对所述待识别图像进行角度调整,得到调整后的待识别图像;第一确定单元具体用于:根据预置的文本识别网络模型以及预置的特征词从所述调整后的待识别图像中确定特征文本区域。可选的,所述装置还包括:构建单元,用于构建所述文本提取网络模型,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成。第二训练单元,用于根据CTC损失值对所述文本提取网络模型进行训练,得到所述训练后的文本提取网络模型。可选的,所述CNN模块由卷积层、第一BN层、第一rulu层以及最大池化层组成,所述RNN模块由flatten层、第一全连接层、第二BN层、第二rulu层、dropout层、第一双向RNN层、第二全连接层、第二双向RNN层、第三全连接层以及softmax层组成。可选的,所述装置还包括:第二提取单元,用于提取所述目标文本。可选的,所述目标文本为门牌文本信息。此外,本申请实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例提供的任一种文本识别方法中的步骤。本申请实施例中,文本识别装置获取包含目标文本的待识别图像;然后根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;再根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息,所述文本提取网络模型由四个CNN模块、一个RNN模块以及一个CTC模块组成;最后根据所述文本信息确定所述目标文本。该方案可以从图像中自动获取目标文本,并且本方案中的文本提取网络模块结合了CNN模块、RNN模块以及CTC模块,可以准确识别文本区域中的文本信息,进而提高目标文本识别的准确率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的文本识别方法的一种应用场景示意图;图2是本申请实施例提供的文本识别方法的一种流程示意图;图3是本申请实施例提供的文本提取网络模型的一种结构示意图;图4是本申请实施例提供的文本识别方法的另一种流程示意图;图5是本申请实本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n获取包含目标文本的待识别图像;/n根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;/n根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成;/n根据所述文本信息确定所述目标文本。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
获取包含目标文本的待识别图像;
根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;
根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成;
根据所述文本信息确定所述目标文本。


2.根据权利要求1所述的方法,其特征在于,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域,包括:
根据所述文本识别网络模型从所述待识别图像中确定文本区域;
根据所述特征词从所述文本区域中确定所述特征文本区域。


3.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息确定所述目标文本,包括:
将所述文本信息映射到训练后的高维空间模型中,得到所述特征词与多个子文本的词距;
将词距最小的子文本确定为所述目标文本。


4.根据权利要求3所述的方法,其特征在于,所述将所述文本信息映射到训练后的高维空间模型中之前,所述方法还包括:
根据训练样本训练所述高维空间模型,所述训练样本为已知词距的样本。


5.根据权利要求1所述的方法,其特征在于,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域之前,所述方法还包括:
根据预置的角度检测模型检测所述待识别图像,得到所述待检测图像的倾斜角度;
根据所述倾斜角度对所述待识别图像进行角度调整,得到调整后的待识别图像;
所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征...

【专利技术属性】
技术研发人员:刘聪海陈亮亮方清曾晓嘉淦小健朱正一崔子玲
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1