图像文本识别方法、装置、设备及其存储介质制造方法及图纸

技术编号：19343689 阅读：16 留言：0更新日期：2018-11-07 14:27

本申请公开了图像文本识别方法、装置、设备及其存储介质。该方法包括：获取待识别图像，待识别图像为行政许可证书图片；将待识别图像输入到预先构建的图像文本识别模型中进行文本检测和文本识别，得到目标识别结果；其中，图像文本识别模型包括图像文本检测子模型和图像文本识别子模型，图像文本检测子模型与图像文本识别子模型分别采用深度学习算法训练得到的，目标识别结果包括与待识别图像中至少一个文本条目相对应的语句信息特征。根据本申请实施例的技术方案，通过预先构建的图像文本识别模型来实现对待识别图像的目标区域进行检测和识别，从而提高了图像文本信息的处理效率，大大节约了用户信息录入的时间。

Image text recognition method, device, device and storage medium thereof

The application discloses an image text recognition method, device, device and storage medium thereof. The method includes: acquiring the image to be recognized and the image to be recognized is the image of the administrative license; inputting the image to be recognized into the pre-constructed image text recognition model for text detection and text recognition to obtain the target recognition results; and the image text recognition model includes the image text detection sub-model and the image text recognition sub-model. The recognition sub-model, the image text detection sub-model and the image text recognition sub-model are trained by depth learning algorithm respectively. The target recognition results include the sentence information features corresponding to at least one text item in the image to be recognized. According to the technical scheme of the embodiment of the present application, the target area of the recognition image is detected and recognized by the pre-constructed image text recognition model, thereby improving the processing efficiency of the image text information and greatly saving the time of user information input.

全部详细技术资料下载

【技术实现步骤摘要】
图像文本识别方法、装置、设备及其存储介质
本申请一般涉及图像处理
，具体涉及基于图像识别检测
，尤其涉及图像文本识别方法、装置、设备及其存储介质。
技术介绍
在快递业务场景中，信息录入是一个不可避免的环节。大量信息重复录入，会造成资源的浪费。例如，商家营业执照的信息录入有时候需要按月更新。现有针对图片处理和识别，有的采用传统文本检测识别技术(OpticalCharacterRecognition，OCR)，该技术包括文字区域检测，图片信息提取及矫正，以及基于传统机器学习方法和HMM模型的文字识别分类器。但是，这些方法在解决商家营业执照的信息录入的问题时，都存在不足，例如，图片自身的限制导致文件检测和信息提取受限，以及在针对细长条文本框检测上表现不佳等问题。亟待提出一种针对营业执照信息提取的方法来解决上述不足。
技术实现思路
鉴于现有技术中的上述缺陷或不足，期望提供一种图像文本识别的技术方案来解决商家营业执照录入的问题。第一方面，本申请实施例提供了一种图像文本识别方法，该方法包括：获取待识别图像，待识别图像为行政许可证书图片；将待识别图像输入到预先构建的图像文本识别模型中进行文本检测和文本识别，得到目标识别结果；图像文本识别模型包括图像文本检测子模型和图像文本识别子模型，图像文本检测子模型与图像文本识别子模型分别采用深度学习算法训练得到的，目标识别结果包括与所述待识别图像中至少一个文本条目相对应的语句信息特征。第二方面，本申请实施例提供了一种图像文本识别装置，该装置包括：第一获取单元，用于获取待识别图像，待识别图像为行政许可证书图片；文本检测单元，用...

【技术保护点】
1.一种图像文本识别方法，其特征在于，该方法包括：获取待识别图像，所述待识别图像为行政许可证书图片；将所述待识别图像输入到预先构建的图像文本识别模型中进行文本检测和文本识别，得到目标识别结果；所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型，所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的，所述目标识别结果包括与所述待识别图像中至少一个文本条目相对应的语句信息特征。

【技术特征摘要】
1.一种图像文本识别方法，其特征在于，该方法包括：获取待识别图像，所述待识别图像为行政许可证书图片；将所述待识别图像输入到预先构建的图像文本识别模型中进行文本检测和文本识别，得到目标识别结果；所述图像文本识别模型包括图像文本检测子模型和图像文本识别子模型，所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的，所述目标识别结果包括与所述待识别图像中至少一个文本条目相对应的语句信息特征。2.根据权利要求1所述的方法，其特征在于，所述图像文本检测子模型与所述图像文本识别子模型分别采用深度学习算法训练得到的，包括：采用第一深度学习算法训练得到所述图像文本检测子模型；以及采用第二深度学习算法训练得到所述图像文本识别子模型。3.根据权利要求2所述的方法，其特征在于，所述采用第一深度学习算法训练得到所述图像文本检测子模型，包括：获取第一图像数据集，所述第一图像数据集包括历史存储的行政许可证书图片；对所述第一图像数据集进行增广处理，得到图像训练集；利用所述图像训练集按照所述第一深度学习算法进行训练学习，得到所述图像文本检测子模型，所述图像文本检测子模型包括多个特征提取层，所述图像文本检测子模型的输出结果与所述多个特征提取层中位于中间层级的特征提取层相关。4.根据权利要求3所述的方法，其特征在于，所述第一深度学习算法采用改进的SSD算法。5.根据权利要求3或4所述的方法，其特征在于，所述采用第二深度学习算法训练得到所述图像文本识别子模型，包括：获取所述图像文本检测子模型的输出结果，将所述输出结果作为第一目标训练集；获取根据运单数据中第一项目预先生成的第二图像数据集，将所述第二图像数据集作为第二目标训练集；利用所述第一目标训练集和所述第二目标训练集按照所述第二深度学习算法进行训练，得到所述图像文本识别子模型，所述图像文本识别子模型输出所述目标识别结果。6.根据权利要求5所述的方法，其特征在于，所述第二深度学习算法包括深度残差网络和长短期记忆神经网络，且利用所述第一目标训练集和所述第二目标训练集按照所述第二深度学习算法进行训练，包括：将第一目标训练集和第二目标训练集输入所述深度残差网络提取所述第一目标训练集和所述第二目标训练集中字符特征向量，所述字符特征向量是由预先生成的高频字字典来表征；然后，将所述字符特征向量输入到所述长短期记忆网络，训练得到语句信息特征，将所述语句信息特征作为所述目标识别结果。7.根据权利要求1-6任一项所述的方法，其特征在于，该方法还包括：将所述图像文本识别子模型输出的语句信息特征和所述图像文本检测子模型的输出结果进行关联存储。8.一种图像文本识别装置，其特征在于，该装置包括：第一获取单元，用于获取待识别图像，所述待识别图像为行政许可证书图片；文本检测...

【专利技术属性】
技术研发人员：冯昊楠，张玉双，冯新杰，庄思待，
申请(专利权)人：顺丰科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人