基于CTC损失的OCR校正方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:33556580 阅读:55 留言:0更新日期:2022-05-26 22:53
本发明专利技术涉及人工智能图像文字识别技术领域,提供了一种基于CTC损失的OCR校正方法、装置、计算机设备和存储介质,所述方法包括:提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵;从所述CTC解码字符序列矩阵中筛选满足字符可信度阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合;遍历所述CTC字符子矩阵集合,基于各所述CTC字符子矩阵中各字符可能值的置信度与字符可信度阈值的大小关系筛选字符的可能值,构建字符串序列,得到字符串序列集合;从所述字符串序列集合中筛选最优字符串序列,输出所述最优字符串序列作为OCR校正结果。采用本方法能够提高OCR识别的准确率。确率。确率。

【技术实现步骤摘要】
基于CTC损失的OCR校正方法、装置、计算机设备和存储介质


[0001]本专利技术属于人工智能图像文字识别
,尤其涉及一种基于CTC损失的OCR校正方法、装置、计算机设备和存储介质。

技术介绍

[0002]OCR(Optical Character Recognition,光学字符识别)是计算机视觉研究领域的分支之一,本质是图像识别。具体来讲就是一种利用扫描仪或者数码相机等电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件建议不编辑加工的技术。
[0003]目前来说,简单环境下比如PDF(Portable Document Format,便携式文档格式)图像、网络截图的OCR识别准确度已经比较高了。但是实际社会生活中对复杂环境下的OCR识别有着越来越多的应用需求。然而,在证件、票据拍照等复杂环境下,因字体打印模糊,拍照局部高亮,实体磨损皱褶等因素,OCR识别的准确率还是有所下降。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高OCR识别准确率的基于CTC损失的OCR校正方法、装置、计算机设备和存储介质。
[0005]本专利技术提供一种基于CTC损失的OCR校正方法,包括:
[0006]提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵;
[0007]从所述CTC解码字符序列矩阵中筛选满足字符可信度阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合;
[0008]遍历所述CTC字符子矩阵集合,基于各所述CTC字符子矩阵中各字符可能值的置信度与字符可信度阈值的大小关系筛选字符的可能值,构建字符串序列,得到字符串序列集合;
[0009]从所述字符串序列集合中筛选最优字符串序列,输出所述最优字符串序列作为OCR校正结果。
[0010]在其中一个实施例中,所述提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵,包括:
[0011]对待检测图像中的文字框进行检测和截取,得到待识别文本;
[0012]利用基于CTC损失的OCR字符识别模型对所述待识别文本进行字符识别,获取CTC解码字符序列以及所述CTC解码字符序列中各字符的可能值;
[0013]根据所述CTC解码字符序列的长度以及各所述字符的可能值,构建CTC解码字符序列矩阵。
[0014]在其中一个实施例中,所述从所述CTC解码字符序列矩阵中筛选满足字符可信度
阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合,包括:
[0015]将所述CTC解码字符序列矩阵中各字符第一可能值的置信度,分别与所述字符可信度阈值进行大小比较,确定字符是否正确;
[0016]当所述字符正确时用可信模式字符表示所述字符,不正确时用不可信模式字符表示所述字符,构建所述CTC解码字符序列矩阵对应的模式字符序列;
[0017]根据所述模式字符序列,枚举所有包含可信子序列的模式字符序列,得到模式字符序列集合;所述可信子序列由可信模式字符组成;
[0018]遍历所述模式字符序列集合,根据所述模式字符序列从所述CTC解码字符序列矩阵筛选字符构建CTC字符子矩阵,得到CTC字符子矩阵集合。
[0019]在其中一个实施例中,所述根据所述模式字符序列,枚举所有包含可信子序列的模式字符序列,得到模式字符序列集合,包括:
[0020]将所述模式字符序列作为二进制字符序列,按照二进制转化为十进制数值作为开始节点,以及根据字符序列长度确定数值作为结束节点;
[0021]从所述开始节点遍历到所述结束节点,将各整数分别与所述十进制数值进行按位或计算并转换为二进制序列得到包含可信子序列的模式字符序列;
[0022]组合各所述包含可信子序列的模式字符序列,得到模式字符序列集合。
[0023]在其中一个实施例中,所述根据所述模式字符序列,枚举所有包含可信子序列的模式字符序列,得到模式字符序列集合,包括:
[0024]构建空的模式字符序列集合,遍历所述模式字符序列中的各模式字符;
[0025]若当前遍历的模式字符是第一位且为可信模式字符,则在所述模式字符序列集合中添加一条第一位为可信模式字符的模式字符序列;
[0026]若当前遍历的模式字符是第一位且为不可信模式字符,则在所述模式字符序列集合中添加一条第一位为可信模式字符的模式字符序列和一条第一位为不可信模式字符的模式字符序列;若当前遍历的模式字符不是第一位且为可信模式字符,则在所述模式字符集合中对已存在的模式字符序列的尾部均追加一位可信模式字符;
[0027]若当前遍历的模式字符不是第一位且为不可信模式字符,则在所述模式字符集合中对已存在的模式字符序列的尾部分别追加一位可信模式字符,且复制所述已存在的模式字符序列,在复制的模式字符序列的尾部分别追加一位不可信模式字符,所述模式字符集合的模式字符序列数量翻倍。
[0028]在其中一个实施例中,所述遍历所述模式字符序列集合,根据所述模式字符序列从所述CTC解码字符序列矩阵筛选字符构建CTC字符子矩阵,得到CTC字符子矩阵集合,包括:
[0029]构建空CTC字符子矩阵;
[0030]遍历所述模式字符序列中的模式字符,若当前遍历的第k个模式字符为可信模式字符,则将所述CTC解码字符序列矩阵中的第k列加入到所述空CTC字符子矩阵中,得到与所述CTC解码字符序列矩阵对应的CTC字符子矩阵;
[0031]将各所述模式字符序列的CTC字符子矩阵组合为CTC字符子矩阵集合。
[0032]在其中一个实施例中,所述遍历所述CTC字符子矩阵集合,基于各所述CTC字符子矩阵中各字符可能值的置信度与字符可信度阈值的大小关系筛选字符可能值,构建字符串
序列,得到字符串序列集合,包括:
[0033]对于所述CTC字符子矩阵集合中的每一个CTC字符子矩阵,分别构建序列长度与所述CTC字符子矩阵中字符数量相等的空字符串序列;
[0034]将所述CTC字符子矩阵中各字符第一可能值的置信度分别与所述字符可信度阈值进行大小比较;
[0035]若所述第一可能值对应的置信度不小于所述字符可信度阈值时,将所述第一可能值加到所述空字符串序列中,否则将字符在所述CTC字符子矩阵中的所有可能值都加入到所述空字符串序列中,得到赋值后的字符串序列;
[0036]对赋值后的所述字符串序列进行排列组合,枚举所有字符串序列,得到字符串序列集合。
[0037]在其中一个实施例中,所述从所述字符串序列集合中筛选最优字符串序列,输出所述最优字符串序列作为OCR校正结果,包括:
[0038]遍历所述字符串序列集合中的每一个字符串序列,确定满足自适应要求的字符串序列作为候本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于CTC损失的OCR校正方法,其特征在于,包括:提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵;从所述CTC解码字符序列矩阵中筛选满足字符可信度阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合;遍历所述CTC字符子矩阵集合,基于各所述CTC字符子矩阵中各字符可能值的置信度与字符可信度阈值的大小关系筛选字符的可能值,构建字符串序列,得到字符串序列集合;从所述字符串序列集合中筛选最优字符串序列,输出所述最优字符串序列作为OCR校正结果。2.根据权利要求1所述的方法,其特征在于,所述提取待识别文本,利用基于CTC损失的OCR识别模型对所述待识别文本进行字符识别,得到CTC解码字符序列矩阵,包括:对待检测图像中的文字框进行检测和截取,得到待识别文本;利用基于CTC损失的OCR字符识别模型对所述待识别文本进行字符识别,获取CTC解码字符序列以及所述CTC解码字符序列中各字符的可能值;根据所述CTC解码字符序列的长度以及各所述字符的可能值,构建CTC解码字符序列矩阵。3.根据权利要求1所述的方法,其特征在于,所述从所述CTC解码字符序列矩阵中筛选满足字符可信度阈值的字符构建CTC字符子矩阵,得到CTC字符子矩阵集合,包括:将所述CTC解码字符序列矩阵中各字符第一可能值的置信度,分别与所述字符可信度阈值进行大小比较,确定字符是否正确;当所述字符正确时用可信模式字符表示所述字符,不正确时用不可信模式字符表示所述字符,构建所述CTC解码字符序列矩阵对应的模式字符序列;根据所述模式字符序列,枚举所有包含可信子序列的模式字符序列,得到模式字符序列集合;所述可信子序列由可信模式字符组成;遍历所述模式字符序列集合,根据所述模式字符序列从所述CTC解码字符序列矩阵筛选字符构建CTC字符子矩阵,得到CTC字符子矩阵集合。4.根据权利要求3所述的方法,其特征在于,所述根据所述模式字符序列,枚举所有包含可信子序列的模式字符序列,得到模式字符序列集合,包括:将所述模式字符序列作为二进制字符序列,按照二进制转化为十进制数值作为开始节点,以及根据字符序列长度确定数值作为结束节点;从所述开始节点遍历到所述结束节点,将各整数分别与所述十进制数值进行按位或计算并转换为二进制序列得到包含可信子序列的模式字符序列;组合各所述包含可信子序列的模式字符序列,得到模式字符序列集合。5.根据权利要求3所述的方法,其特征在于,所述根据所述模式字符序列,枚举所有包含可信子序列的模式字符序列,得到模式字符序列集合,包括:构建空的模式字符序列集合,遍历所述模式字符序列中的各模式字符;若当前遍历的模式字符是第一位且为可信模式字符,则在所述模式字符序列集合中添加一条第一位为可信模式字符的模式字符序列;若当前遍历的模式字符是第一位且为不可信模式字符,则在所述模式字符序列集合中
添加一条第一位为可信模式字符的模式字符序列和一条第一位为不可信模式字符的模式字符序列;若当前遍历的模式字符不是第一位且为可信模式字符,则在所述模式字符集合中对已存在的模式字符序列的尾部均追加一位可信模式字符;若当前遍历的模式字符不是第一位且为不可信模式字符,则在所述模式字符集合中对已存在的模式字符序列的尾部分别追加一位可信模式字符,且复制所述已存在的模式字符序列,在复制的模式字符...

【专利技术属性】
技术研发人员:索红亮郭建京周忠诚黄九鸣张圣栋
申请(专利权)人:湖南星汉数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1