识别图片中信息的方法、装置、设备及存储介质制造方法及图纸

技术编号：27537421 阅读：14 留言：0更新日期：2021-03-03 11:26

本发明专利技术涉及一种识别图片中信息的方法、装置、设备及存储介质，该方法包括：获取上传的单据图片，利用预先训练好的分类器对单据图片进行分类，得到单据图片对应的单据类型；分析单据图片中的单据是否处于正摆放状态，若不是正摆放状态，则对单据图片进行旋转处理，使得单据处于正摆放状态；获取单据类型对应的、预先训练好的分割网络模型，将单据图片输入分割网络模型中，获取分割网络模型输出的单据图片中各个关键信息所处区域对应的坐标信息，基于各个坐标信息截取单据图片，得到包含各个关键信息对应的各个待处理图片；对各个待处理图片进行检测、识别处理，得到各个待处理图片中的关键信息。本发明专利技术能够提高图片信息识别的准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
识别图片中信息的方法、装置、设备及存储介质

[0001]本专利技术涉及图像处理
，尤其涉及一种识别图片中信息的方法、装置、设备及存储介质。

技术介绍

[0002]金融业务的机构一般需要对客户提交的单据进行处理，识别单据中的文本信息并进行分析或归档等处理。例如，银行贷款业务和借贷金融业务需要对客户提交银行理财结单进行识别，以检查信息真实性，包括客户信息、客户资产概况、客户流水等信息的检查。然而，单据中包含的文本信息较多，信息量大。目前，识别单据中的文本信息大多采用光学字符识别(Optical Character Recognition,OCR)方法进行识别，该方法对于文本信息较少或简单的单据能够得到较好的识别效果，但对于文本信息较多且图像背景较复杂的单据，其识别准确率有待进一步提高。

技术实现思路

[0003]本专利技术的目的在于提供一种识别图片中信息的方法、装置、设备及存储介质，旨在提高图片信息识别的准确率。
[0004]本专利技术提供一种识别图片中信息的方法，包括：
[0005]获取上传的单据图片，利用预先训练好的分类器对所述单据图片进行分类，得到所述单据图片对应的单据类型；
[0006]分析所述单据图片中的单据是否处于正摆放状态，若不是正摆放状态，则对所述单据图片进行旋转处理，使得所述单据处于正摆放状态；
[0007]获取所述单据类型对应的、预先训练好的分割网络模型，将所述单据图片输入所述分割网络模型中，获取所述分割网络模型输出的所述单据图片中各个关键信息所处

【技术保护点】

【技术特征摘要】
1.一种识别图片中信息的方法，其特征在于，包括：获取上传的单据图片，利用预先训练好的分类器对所述单据图片进行分类，得到所述单据图片对应的单据类型；分析所述单据图片中的单据是否处于正摆放状态，若不是正摆放状态，则对所述单据图片进行旋转处理，使得所述单据处于正摆放状态；获取所述单据类型对应的、预先训练好的分割网络模型，将所述单据图片输入所述分割网络模型中，获取所述分割网络模型输出的所述单据图片中各个关键信息所处区域对应的坐标信息，基于各个坐标信息截取所述单据图片，得到包含各个关键信息对应的各个待处理图片；对各个待处理图片进行检测、识别处理，得到各个待处理图片中的关键信息。2.根据权利要求1所述的识别图片中信息的方法，其特征在于，所述对各个待处理图片进行检测、识别处理，得到各个待处理图片中的关键信息的步骤，具体包括：对各个待处理图片进行文本检测，得到各个待处理图片的文本框，以及各文本框中字符的数量、字符的位置信息，截取各个待处理图片的文本框；分析各个文本框中字符的数量是否大于等于预设的第一数量阈值；若有文本框中字符的数量大于等于所述第一数量阈值，则将字符的数量大于等于所述第一数量阈值的文本框切割为至少两个子图片，所述至少两个子图片中每一子图片中字符的数量在预定的数量范围内；将所述各个子图片输入预先训练好的识别模型中，获取所述识别模型输出的所述各个子图片对应的文本；根据所述字符的位置信息拼接所述各个子图片对应的文本，得到所述文本框中对应的关键信息。3.根据权利要求2所述的识别图片中信息的方法，其特征在于，所述对各个待处理图片进行检测、识别处理，得到各个待处理图片中的关键信息的步骤，进一步包括：若有文本框中字符的数量小于所述第一数量阈值，则将字符的数量小于所述第一数量阈值的文本框输入所述识别模型中，获取所述识别模型输出的文本，得到所述文本框中的关键信息。4.根据权利要求1至3任一项所述的识别图片中信息的方法，其特征在于，所述识别图片中信息的方法还包括按照以下方式训练分类器，包括：收集大于预设的第二数量阈值的单据图片，对收集的每一单据图片进行单据类型的标注，将标注后的单据图片作为样本数据输入所述分类器中进行训练，得到训练好的分类器。5.根据权利要求1至3任一项所述的识别图片中信息的方法，其特征在于，所述分析所述单据图片中的单据是否处于正摆放状态，若不是正摆放状态，则对所述单据图片进行旋转处理，使得所述单据处于正摆放状态的步骤，具体包括：检测所述单据图片中单据下方的边缘线，获取所述边缘线与水平方向的夹角，若所述夹角不等于0度，则将所述单据图片按照顺时...

【专利技术属性】
技术研发人员：蔡南平，盛欢，徐欢，邵诚，
申请(专利权)人：天冕信息技术深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人