System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于图像处理与人工智能,特别是涉及一种基于深度学习的机车工单信息智能识别方法及系统。
技术介绍
1、近年来我国政府高度重视人工智能产业发展战略,持续从各方面支持与促进人工智能发展。其中机车工单作为机车检修、运行的重要安全保证,人们往往需要耗费大量的人力物力整理、阅读、以及信息录入。因此为了减少在工单上的耗费的资源成本,高精度地提取到机车工单的具体信息,辅助机车检修等后勤的高效运作,数字化机车工单和相关纸质记录是机车行业走向现代化和智能化的重要步骤,研究出一种可以实际应用的机车工单高精度提取算法具有重大意义。
2、机车工单信息智能识别存在其特定的技术难点,需要进行无模板工单表格重建、工单内容存在手写文字潦草、模糊、重叠、密集、细小文本等情况,机车工单图像数据采集场景复杂多样,颜色分布极度不均、部分存在严重扭曲。
3、现有的表格重建技术大多有表格的模板信息,此类技术为有模板重建表格技术。无模板重建表格技术在现有的方法中难以准确地捕捉表格单元格之间的关系,因此准确率低,重建失败率高,尽管现有的光学文字检测识别技术已经在文档的数字化领域取得了不小的成就,但在处理机车工单图像数据中的潦草、模糊、重叠、密集、细小中文手写文本时存在一定的挑战,存在识别不准确,文本检测偏移断框等等情况。相比通用的文字检测识别,机车工单图像数据采集场景复杂多样,需要特定的图像预处理方式和数据增强方式以提高工单数字化的准确性和模型的鲁棒性。
技术实现思路
1、(1)要解决的技术问题<
...【技术保护点】
1.一种基于深度学习的机车工单信息智能识别方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤2中,对所述机车工单图像数据进行图像预处理得到预处理后的图像数据,对应方法包括以下步骤:
3.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤3中,所述利用预处理后的图像数据进行文本检测和文本识别,对应方法包括以下步骤:
4.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤4中,利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建中的无模板表格重建采用HRNet网络框架进行关键点检测,利用扫描线法和连通域法进行表格重建;方法分为单通道方法和四通道方法重建表格,首先会进行四通道方法重建表格,当四通道方法重建失败时,将采用单通道方法重建表格。
5.根据权利要求2所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤215中的利用文本方向分类器,对机车工单图像数据的文本方向进行
6.根据权利要求3所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤311中的文本检测网络采用改进的增强细小文本区域响应的DBNet框架,其模型设计了针对细小文本区域特征提取模块,并通过后处理的过滤算法和增强算法适应工单文本检测,所述文本检测网络算法流程包括以下步骤:
7.根据权利要求3所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤312中的文本识别网络采用DCNResNet50骨干网络,并在所述文本识别网络的训练过程中引入正则项,防止网络过置信;所述DCNResNet50骨干网络算法包括以下步骤:
8.根据权利要求6所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤31101中的DCN包括以下步骤:
9.根据权利要求6所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤31105中的改进后的后处理算法包括以下步骤:
10.根据权利要求7所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤31203中的Attention解码包括以下步骤:
11.根据权利要求7所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤31204中的改进序列置信度计算,方法如下:
12.根据权利要求7所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤312中的引入正则项方法如下:
13.根据权利要求4所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤4中的四通道方法重建表格,包括以下步骤:
14.根据权利要求4所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤4中的单通道方法重建表格,包括以下步骤:
15.根据权利要求13或14所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述轮廓中心距算法,包括以下步骤:
16.根据权利要求14所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤425中的连通域法包括以下步骤:
17.根据权利要求13或14所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述扫描线法包括以下步骤:
18.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:在所述步骤3的文本识别中,使用基于困难样本挖掘的半自动数据标注流程,在进一步提升文本识别模型性能上,极大减少了标注成本;
19.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:在所述步骤3的文本识别中,采用基于标注的数据和困难样本挖掘的合成方式,通过将真实机车工单图像数据背景、字频出现较低的字符和多种手写字体项结合,能获得贴近真实场景的广阔的工单文本行数据;
20.一种基于深度学习的机车工单信息识别系统,其特征在于:包括:机车工单图像数据获取模块、图像预处理模块、图像数据文本检测和文本识别模块、无模板表格重建和文本信息输出模块;所述机车工单图像数据获取模块,用于获得所述机车工单图像数据,所述图像预处理模块,用于对所述机车工单图像数据进行图像背景消除、图像方向矫正、文本方向进行预分类;所述图像文本检测和所述文本识别模块,用于获取文本区域和文本信息;所述无模板表格重建和文本信息输出模块,用于获得所述机车工单图像的文本信息及文本之间的联...
【技术特征摘要】
1.一种基于深度学习的机车工单信息智能识别方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤2中,对所述机车工单图像数据进行图像预处理得到预处理后的图像数据,对应方法包括以下步骤:
3.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤3中,所述利用预处理后的图像数据进行文本检测和文本识别,对应方法包括以下步骤:
4.根据权利要求1所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤4中,利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建中的无模板表格重建采用hrnet网络框架进行关键点检测,利用扫描线法和连通域法进行表格重建;方法分为单通道方法和四通道方法重建表格,首先会进行四通道方法重建表格,当四通道方法重建失败时,将采用单通道方法重建表格。
5.根据权利要求2所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤215中的利用文本方向分类器,对机车工单图像数据的文本方向进行预分类,包括以下步骤:
6.根据权利要求3所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤311中的文本检测网络采用改进的增强细小文本区域响应的dbnet框架,其模型设计了针对细小文本区域特征提取模块,并通过后处理的过滤算法和增强算法适应工单文本检测,所述文本检测网络算法流程包括以下步骤:
7.根据权利要求3所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤312中的文本识别网络采用dcnresnet50骨干网络,并在所述文本识别网络的训练过程中引入正则项,防止网络过置信;所述dcnresnet50骨干网络算法包括以下步骤:
8.根据权利要求6所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤31101中的dcn包括以下步骤:
9.根据权利要求6所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤31105中的改进后的后处理算法包括以下步骤:
10.根据权利要求7所述的一种基于深度学习的机车工单信息智能识别方法,其特征在于:所述步骤31203中的atte...
【专利技术属性】
技术研发人员:黄双萍,黄森,张慧源,李晨,徐之昊,彭文杰,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。