System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的票据、表格文本实时识别方法技术_技高网

一种基于深度学习的票据、表格文本实时识别方法技术

技术编号:40673011 阅读:2 留言:0更新日期:2024-03-18 19:10
本发明专利技术结合深度学习与自然语言处理算法,具体公开了一种基于深度学习的票据、表格文本实时识别方法,该方法包括如下步骤:s1、对待识别的票据表格图片进行去噪等预处理;s2、对票据、表格数据进行自动标注和人工修正,得到准确的文本标签和目标文本区域;s3、对文本标签进行数据分布分析,根据分布情况进行针对性的样本扩充和数据增广;s4、以目标文本区域为输入,分解字符,采用局部和全局模块感知字符间与字符内的关系,充分挖掘特征;s5、进行测试,选择适合的规则后处理策略优化识别结果;s6、将结果实时反馈。本发明专利技术方法通过使用深度学习算法来分析票据表格文本,采用局部与全局模块充分挖掘文本细粒度特征,快速获得准确、鲁棒的识别结果。

【技术实现步骤摘要】

本专利技术结合深度学习与自然语言处理算法,具体公开了一种针对票据及表格文本进行实时性识别的方法。


技术介绍

1、近年来,随着数字化和自动化的快速发展,文本识别技术对于企业管理、市场调研、财务分析等领域具有重要的应用价值,通过文本识别技术,可以实现自动化文本处理和信息提取,提高效率和准确性;同时支持数据分析和决策,从而推动数字化转型和智能化发展,为各行各业提供了更高效、准确、智能的文本处理解决方案,为社会进步和发展带来了积极影响。

2、传统文本识别方法通常基于光学字符识别技术,但在处理复杂的票据和表格数据时存在一些缺点。首先,由于票据和表格数据中的文本通常具有不规则、变形、噪声等特点,传统方法在特征提取和分类器设计上难以克服这些问题,导致识别准确率较低。其次,传统方法需要手动对齐标签和输入,容易出现标签和输入不匹配的情况,增加了人工干预和时间成本。此外,传统方法对于大量的文本输入需要较长的处理时间,不适用于实时处理和大规模数据处理等场景。

3、目前,基于深度学习的相关方法更为常用,广泛的文本识别模型通常包含提取图像特征的视觉模型和将视觉特征转录为序列特征的序列模型。这种架构虽然准确,但相较复杂且lstm的效率较低,在实际的应用场景中也存在诸多限制。

4、因此,结合深度学习和自然语言处理算法,针对票据表格数据构建一种基于深度学习的实时文本识别方法是非常有必要的,本方法具有快速、准确、鲁棒的特点,能够极大地提高票据和表格数据处理的效率和精度,为企业和个人带来更高效、便捷的数据处理体验。

/>

技术实现思路

1、本专利技术的目的在于提出了一种基于深度学习的票据、表格文本实时识别方法,其采用如下方案:

2、一种基于深度学习的票据、表格文本实时识别方法,包括如下步骤:

3、s1、对待识别的票据表格等文本图片进行去噪等预处理;

4、s2、对票据、表格数据进行自动标注和人工修正,得到准确的文本标签和目标文本区域;

5、s3、对文本标签进行数据分布分析,根据分布情况进行针对性的样本扩充和数据增广;

6、s4、以目标文本区域为输入,分解字符,采用局部和全局模块感知字符间与字符内的关系,充分挖掘特征;

7、s5、进行测试,将结果实时反馈。

8、进一步,上述步骤s1中,采用图像去噪、灰度化等操作对待识别的票据表格等文本图片进行预处理。

9、进一步,上述步骤s2中,利用自动标注+人工修正的新模式对票据、表格数据进行标注,以获得准确的文本标签和目标文本区域。

10、进一步,上述步骤s3中,针对文本标签进行数据分布分析,以平衡语料词频为目的,针对性的采用样本扩充和数据增广策略,挖掘文字上下信息。

11、进一步,上述步骤s4中,具体的处理过程如下:

12、s41、首先在步骤s3的基础上,将输入的目标文本区域分解成被称为字符组件的部件;

13、s42、通过局部特征学习模块,在步骤s41的基础上,探索字符内在相关性;

14、s43、通过全局特征学习模块,在步骤s41的基础上,探索字符之间的关系;

15、s44、融合步骤s42与步骤s43提取的特征,从而实现多层次的字符组件感知;

16、s45、根据步骤s44融合的特征,送入分类器中预测字符类别;

17、进一步,上述步骤s5中,根据s4所得模型权重文件进行测试,选择适合的规则后处理策略优化识别结果。

18、进一步,上述步骤s6中,将步骤s5所得的识别结果进行实时反馈,提升效率节省时间成本。

19、本专利技术具有如下优点:

20、首先,本专利技术方法通过使用自动标注和人工修正的方式获取准确的文本标签和目标文本区域,提高了文本识别的准确性和可靠性。其次,针对不同数据分布情况进行样本扩充和数据增广,使得模型更好地适应不同的数据特点,提高了鲁棒性。此外,采用全局特征与局部特征融合的多尺度特征提取架构,能够充分捕捉字符的视觉和语义特征,提高了文本识别的准确率。最后,通过后处理策略优化识别结果,进一步提升了文本识别的精度和稳定性。综上所述,本专利技术在预处理、标注、特征提取和后处理等方面都有创新,能够有效地应用于票据和表格文本的实时性识别。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的票据、表格文本实时识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s1中,采用图像去噪、灰度化等操作对待识别的票据表格等文本图片进行预处理。

3.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s2中,利用自动标注+人工修正的新模式对票据、表格数据进行标注,以获得准确的文本标签和目标文本区域。

4.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s3中,针对文本标签进行数据分布分析,以平衡语料词频为目的,针对性的采用样本扩充和数据增广策略,挖掘文字上下信息。

5.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s4中,具体的处理过程如下:

6.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s5中,根据s4所得模型权重文件进行测试,选择适合的规则后处理策略优化识别结果。</p>

7.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s6中,将所得的识别结果进行实时反馈,提升效率节省时间成本。

...

【技术特征摘要】

1.一种基于深度学习的票据、表格文本实时识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s1中,采用图像去噪、灰度化等操作对待识别的票据表格等文本图片进行预处理。

3.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s2中,利用自动标注+人工修正的新模式对票据、表格数据进行标注,以获得准确的文本标签和目标文本区域。

4.根据权利要求1所述的一种基于深度学习的票据、表格文本实时识别方法,其特征在于,所述步骤s3中,针对文本...

【专利技术属性】
技术研发人员:李宗民徐畅白云张明珠戎光彩王立
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1