使用全卷积神经网络的字符识别的系统和方法技术方案

技术编号：21841224 阅读：28 留言：0更新日期：2019-08-10 21:37

本公开的实施例包括一种用于从经数字化的对象中提取符号的方法。该方法包括参照词典处理单词块。该方法包括将单词块与词典中的单词进行比较，该比较提供置信度因子。该方法包括当置信度因子大于预定阈值时输出等于该单词的预测结果。该方法包括在置信度因子小于预定阈值时评估单词块的属性。该方法包括基于单词块的属性来预测单词块的值。该方法还包括确定单词块的预测值的错误率。该方法包括输出单词块的值，该输出等于与具有最低错误率的单词块的值相对应的计算值。

A Character Recognition System Using Full Convolutional Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用全卷积神经网络的字符识别的系统和方法相关申请的交叉引用本申请要求2016年11月14日提交的题为“SYSTEMANDMETHODOFCHARACTERRECOGNITIONUSINGFULLYCONVOLUTIONALNEURALNETWORKS”的美国临时申请序列No.62/422,000，以及2017年6月26日提交的题为“SYSTEMANDMETHODOFCHARACTERRECOGNITIONUSINGFULLYCONVOLUTIONALNEURALNETWORKSWITHATTENTION”的共同未决的美国临时申请序列No.62/524,983，以及2017年9月19日提交的题为“SYSTEMANDMETHODOFCHARACTERRECOGNITIONUSINGFULLYCONVOLUTIONALNEURALNETWORKS”的美国专利申请序列No.15/709,014以及2017年9月19日提交的标题为“SYSTEMANDMETHODOFCHARACTERRECOGNITIONUSINGFULLYCONVOLUTIONALNEURALNETWORKSWITHATTENTION”的共同未决的美国专利申请序列No.15/708,918的优先权和权益，它们的全部公开内容由此以它们的整体出于所有目的通过引用并入本文。
技术介绍
1.专利
本公开涉及数字式字符识别。更具体地，本公开涉及用于手写文本或数字化的文本的数字字符识别的系统和方法。2.相关技术的描述智能字符识别(ICR)的任务是破解数字化手写文本。在某些系统中，基于位于文本块之间的空白空间提...

【技术保护点】
1.一种系统，包括：至少一个处理器；以及存储器，所述存储器包括有指令，所述指令在被所述至少一个处理器执行时使得所述系统：接收经数字化的对象，所述经数字化的对象对应于包括至少一个符号的图像；通过确定所述经数字化的对象中的空白分隔符，从所述经数字化的对象形成数字化的行块；将所述行块转换成由空白来分隔的一个或多个单词块，所述一个或多个单词块具有与形成所述一个或多个单词块的至少一个符号相关联的值；将所述一个或多个单词块中的每个单词块的尺寸调整至固定高度的标准表示；用词典评估所述一个或多个单词块中的每个单词块，所述词典包含常见单词的集合；当所述单词块中的一个或多个单词块与所述集合中的单词相对应时，输出第一单词预测结果；当所述一个或多个单词块与所述集合不对应时，确定所述一个或多个单词块中的每个单词块中的多个符号和多个空格；评估所述一个或多个单词块中的所述符号，所述评估对与所述一个或多个单词块中的所述符号相关联的值进行确认；对所述一个或多个单词块执行盖然性校正；以及输出第二单词预测结果，所述第二单词预测结果对应于所述单词块的所述值。

【技术特征摘要】
【国外来华专利技术】2016.11.14 US 62/422,000;2017.06.26 US 62/524,983;1.一种系统，包括：至少一个处理器；以及存储器，所述存储器包括有指令，所述指令在被所述至少一个处理器执行时使得所述系统：接收经数字化的对象，所述经数字化的对象对应于包括至少一个符号的图像；通过确定所述经数字化的对象中的空白分隔符，从所述经数字化的对象形成数字化的行块；将所述行块转换成由空白来分隔的一个或多个单词块，所述一个或多个单词块具有与形成所述一个或多个单词块的至少一个符号相关联的值；将所述一个或多个单词块中的每个单词块的尺寸调整至固定高度的标准表示；用词典评估所述一个或多个单词块中的每个单词块，所述词典包含常见单词的集合；当所述单词块中的一个或多个单词块与所述集合中的单词相对应时，输出第一单词预测结果；当所述一个或多个单词块与所述集合不对应时，确定所述一个或多个单词块中的每个单词块中的多个符号和多个空格；评估所述一个或多个单词块中的所述符号，所述评估对与所述一个或多个单词块中的所述符号相关联的值进行确认；对所述一个或多个单词块执行盖然性校正；以及输出第二单词预测结果，所述第二单词预测结果对应于所述单词块的所述值。2.根据权利要求1所述的系统，其中，所述指令在被执行时还使得所述至少一个处理器将所述一个或多个单词块中的每个单词块的尺寸调整为标准的宽度间隔，其中，所述宽度是以在所述单词块中的符号的数目的预测结果为基础的。3.根据权利要求1所述的系统，其中，盖然性校正包括：将单词概率分配给所述一个或多个单词块中的每个单词块，所述概率是与形成所述单词块的每个符号的可能性相关联的；以及将所述一个或多个单词块与词典单词进行匹配，所述匹配包括在所述一个或多个单词块中插入符号、删除符号或替换符号以与词典单词相对应。4.根据权利要求1所述的系统，其中，使用神经网络执行对所述符号的所述值的确认，所述神经网络包括进行与所述符号的所述值相关联的预测的感受野的层级。5.根据权利要求4所述的系统，其中，所述神经网络是全卷积神经网络，并且所述感受野的层级能够包括位于每个符号之前或之后的所述符号的多个部分。6.根据权利要求5所述的系统，其中，所述符号出现在不同的行块上，所述符号是不同句子的一部分，所述符号是不同段落的一部分，或者所述符号位于所述经数字化的对象的不同页面上。7.一种由计算机实现的方法，包括：获得单词块输入，所述单词块输入包括至少一个符号；对照词典来处理所述单词块，所述词典包含最常见单词的集合；将所述单词块与所述词典中的单词进行比较，所述比较提供所述单词块对应于所述单词的置信度因子；当所述置信度因子大于预定阈值时，输出等于所述单词的预测结果；当所述置信度因子小于所述预定阈值时，评估所述单词块的属性，所述属性是所述单词块的长度和所述单词块中的符号的数目中的至少一者；基于所述单词块的所述属性来预测所述单词块的值；确定所述单词块的预测值的错误率，所述错误率对应于被预测的单词与来自所述词典的一个或多个单词之间的经计算的差值；以及输出所述单词块的值，所述输出等于当所述置信度因子小于所述预定阈值时与具有最低错误率的所述单词块的值相对应的计算值。8.根据权利要求7所述的由计算机实现的方法，还包括：接收数字图像，所述数字图像包括所述至少一个符号；从所述数字图像中提取文本区域；将所述文本区域分割成文本行；将所述文本行分割成一个或多个单词块，所述一个或多个单词块包括所述至少一个符号。9.根据权利要求7所述的由计算机实现的方法，还包括：对所述单词块进行尺寸调整，所述尺寸调整对应于所述单词块的高度或宽度中的至少一者，所述尺寸调整使得所述单词块...

【专利技术属性】
技术研发人员：费利佩·彼得罗斯基·萨奇，雷蒙德·普图查，弗兰克·布罗克勒，保罗·胡特考斯基，瓦特拉·辛格，
申请(专利权)人：柯达阿拉里斯股份有限公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人