A text sequence correction algorithm, system and equipment based on OCR and bidirectional LSTM. The method includes: S1, acquiring text and image; S2, the text image is obtained through OCR preprocessing to get the first sequence set X = {x0, x1,... Xm}; S3, the positive sequence of {x0, S3,... Xm}, and the reverse order of {xm, XM 1,..., x0} input bidirectional LSTM encoder in the context of constructing vector C; S4 decoder decodes the context vector C by two-dimensional LSTM constructs were obtained second Y sequences. The system includes the image acquisition module, the OCR processing module, the encoder of the bidirectional LSTM, and the decoder of the bidirectional LSTM construction. The device is used to carry the execution program of the method.
【技术实现步骤摘要】
基于OCR和双向LSTM的文字序列纠错算法、系统及其设备
本专利技术涉及图像文字识别过程中机器翻译领域,尤其涉及基于OCR和双向LSTM的文字序列纠错算法、系统及其设备。
技术介绍
近年来,随着机器学习的迅猛发展,各种机器翻译算法层出不穷,被广泛应用的有OCR文字识别算法。OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。然而,由于图像光照、角度等影响,OCR识别文字算法精度很难达到期望。
技术实现思路
为了解决上述技术问题,本专利技术提出基于OCR和双向LSTM的文字序列纠错算法。系统及其设备,它能够有效的提高文字序列识别的准确度。为了实现上述目的,本专利技术的技术方案为:基于OCR和双向LSTM的文字序列纠错算法,适用于图像中文字的识别,包括步骤:S1,获取文字图像;S2,所述文字图像经过OCR预处理得到第一序列集合X={x0,x1,...,xm};S3,将正序的{x0,x1,…,xm}以及反序的{xm,xm-1,...,x0}输入双向LSTM构建的编码器中得到语境向量c;S4,所述语境向量c经双向LSTM构建的解码器解码分别获得第二序列集合Y。步骤S3中所述的语境向量c为:c=Φ({h1,h2,…,hTS});ht=f(xt,ht-1) ...
【技术保护点】
基于OCR和双向LSTM的文字序列纠错算法,适用于图像中文字的识别,其特征在于,包括步骤:S1,获取文字图像;S2,所述文字图像经过OCR预处理得到第一序列集合X={x0,x1,...,xm};S3,将正序的{x0,x1,…,xm}以及反序的{xm,xm‑1,...,x0}输入双向LSTM构建的编码器中得到语境向量c;S4,所述语境向量c经双向LSTM构建的解码器解码分别获得第二序列集合Y。
【技术特征摘要】
1.基于OCR和双向LSTM的文字序列纠错算法,适用于图像中文字的识别,其特征在于,包括步骤:S1,获取文字图像;S2,所述文字图像经过OCR预处理得到第一序列集合X={x0,x1,...,xm};S3,将正序的{x0,x1,…,xm}以及反序的{xm,xm-1,...,x0}输入双向LSTM构建的编码器中得到语境向量c;S4,所述语境向量c经双向LSTM构建的解码器解码分别获得第二序列集合Y。2.根据权利要求1所述的基于OCR和双向LSTM的文字序列纠错算法,其特征在于,步骤S3中所述的语境向量c为:c=Φ({h1,h2,…,hTS});ht=f(xt,ht-1)。3.根据权利要求1所述的基于OCR和双向LSTM的文字序列纠错算法,其特征在于,步骤S4中所述的第二序列集合Y为:Y=(y0,y1,…,yn);st=f(yt-1,st-1,c);p(yt|y<t,X)=g(yt-1,st,c)。4.根据权利要求2或3所述的基于OCR和双向LSTM的文字序列纠错算法,其特征在于,步骤S1中所述的文字图像为快递单图像。5.根据权利要求2或3所述的基...
【专利技术属性】
技术研发人员:王志成,邝展豪,高磊,刘志欣,王亮,
申请(专利权)人:顺丰科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。