Method, text image recognition OCR and Bi in LSTM system and equipment based on the said method comprises the steps of: S1, S2, to obtain the target image; image of the steps in S1 for OCR recognition output sequence of OCR set; S3, the steps in S2 OCR output all of the output set in sequence one by one sequence is converted to a digital vector; S4, to reduce the dimension of the vector of numbers each of the steps in S3; S5, S4 will step through all digital vector dimension after each input text sequence Bi LSTM model. The system includes image acquisition module, OCR conversion module, identification module, vector vector dimension reduction module and Bi LSTM module; the device includes storing a computer readable medium, computer program, the program is running for executing the method. It effectively improves the accuracy of the recognition of the text information in the image.
【技术实现步骤摘要】
基于OCR和Bi-LSTM的识别图像中文字信息的方法、系统及设备
本专利技术涉及计算机软件中图像识别
,尤其涉及基于OCR和Bi-LSTM的识别图像中文字信息的方法、系统及设备。
技术介绍
近年来,随着电子商务的迅猛发展,快件收寄呈爆发式增长,物流行业的快递工作量急剧增加。货运单的地址信息是物件投递过程中的重要依据,能否正确识别该地址信息是物件能否被正确投递的关键。而快递单地址信息录入主要是由传统的人工逐一录入。传统的人工录入快递单地址模式效率低,造成人力成本的极大浪费。并且由于手写快递单字迹复杂、快递单本身存在地址不正确或不全的风险,导致派送困难。
技术实现思路
为了解决上述技术问题,本专利技术提出基于OCR和Bi-LSTM的识别图像中文字信息的方法、系统及设备,它有效的提高了图像中文字信息识别的准确度。为了实现上述目的,本专利技术的技术方案为:基于OCR和Bi-LSTM的识别图像中文字信息的方法,包括步骤:S1,获取目标图像;S2,对步骤S1中所述的图像进行OCR识别得到OCR的输出序列集合;S3,将步骤S2中所述的OCR的输出序列集合中的全部输出序列逐一转 ...
【技术保护点】
基于OCR和Bi‑LSTM的识别图像中文字信息的方法,其特征是,包括步骤:S1,获取目标图像;S2,对步骤S1中所述的图像进行OCR识别得到OCR的输出序列集合;S3,将步骤S2中所述的OCR的输出序列集合中的全部输出序列逐一转换为数字向量;S4,对步骤S3中每个所述的数字向量进行降维处理;S5,将步骤S4中经过降维处理后的全部数字向量逐一输入Bi‑LSTM模型中得到文本序列。
【技术特征摘要】
1.基于OCR和Bi-LSTM的识别图像中文字信息的方法,其特征是,包括步骤:S1,获取目标图像;S2,对步骤S1中所述的图像进行OCR识别得到OCR的输出序列集合;S3,将步骤S2中所述的OCR的输出序列集合中的全部输出序列逐一转换为数字向量;S4,对步骤S3中每个所述的数字向量进行降维处理;S5,将步骤S4中经过降维处理后的全部数字向量逐一输入Bi-LSTM模型中得到文本序列。2.根据权利要求1所述的基于OCR和Bi-LSTM的识别图像中文字信息的方法,其特征是,所述步骤S2包括:S21,对步骤S1中所述的图像进行OCR识别得到结果队列集合;S22,将步骤S21中所述的结果队列集合中的全部结果队列逐一输入语言模型中,得到OCR的输出序列集合。3.根据权利要求1所述的基于OCR和Bi-LSTM的识别图像中文字信息的方法,其特征是,所述步骤S5包括:S51,将S4中经过降维处理后的数字向量输入Bi-LSTM编码器,生成特征向量;S52,将所述特征向量输入Bi-LSTM解码器,得到输出向量;S53,将所述输出向量输入Softmax算法模块,得到字ID;S54,根据字典的对应关系,将所述字ID转换为文本序列。4.根据权利要求1所述的基于OCR和Bi-LSTM的识别图像中文字信息的方法,其特征是,步骤S21中所述OCR识别的阈值为系统允许的最低reliability阈值。5.根据权利要求2所述的基于OCR和Bi-LSTM的识别图像中文字信息的方法,其特征是,所述步骤S21中OCR的识别区域为所述图像中的文字信息所属的区域。6.根据权利要求1所述的基于OCR和Bi-LSTM的识别图像中文字信息的方法,其特征是,所述步...
【专利技术属性】
技术研发人员:高磊,邝展豪,王志成,刘志欣,王亮,
申请(专利权)人:顺丰科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。