System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文档区域检测模型训练及文档区域检测方法和装置制造方法及图纸_技高网

文档区域检测模型训练及文档区域检测方法和装置制造方法及图纸

技术编号:40601680 阅读:4 留言:0更新日期:2024-03-12 22:06
本申请提供一种文档区域检测模型训练及文档区域检测方法和装置,涉及人工智能技术领域,该方法包括:获取训练样本,训练样本包括样本图像,以及样本图像的M个标注角点坐标和标注类别,M个标注角点坐标指示样本图像上的文档区域,标注类别指示样本图像上是否包括文档区域;将样本图像输入至文档区域检测模型,得到文档区域检测模型输出的N个检测角点坐标和检测分类概率,检测分类概率指示样本图像中包括文档区域的置信度,N个检测角点坐标指示样本图像中检测出的区域;根据M个标注角点坐标、标注类别、N个检测角点坐标和检测分类概率,对文档区域检测模型的参数进行调整。能够提高文档区域检测的准确性。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种文档区域检测模型训练及文档区域检测方法和装置


技术介绍

1、文档区域检测,指的是通过一定的技术手段检测出图像中的文档区域的过程,文档区域检测是进行文字识别的基础,文档区域的检测对于文字识别的效率和准确率具有重要影响。

2、目前的文档区域检测通常是由文档区域检测模型完成的,将图像输入至文档区域检测模型后,由文档区域检测模型在图像上用矩形框表示出该文档区域,实现文档区域的检测。

3、由于上述方案是通过矩形框来标识文档区域的,针对包括不规则形状的文档区域,上述方案检测出的区域会包括一些不属于文档的区域,不利于后续的文字识别。


技术实现思路

1、本申请提供一种文档区域检测模型训练及文档区域检测方法和装置,用以解决现有文档区域检测方案容易将不属于文档的区域识别为文档区域的问题。

2、第一方面,本申请提供一种文档区域检测模型训练方法,包括:

3、获取训练样本,所述训练样本包括样本图像,以及所述样本图像的m个标注角点坐标和标注类别,所述m个标注角点坐标指示所述样本图像上的文档区域,所述标注类别指示所述样本图像上是否包括文档区域,所述m为大于或等于1的整数;

4、将所述样本图像输入至文档区域检测模型,得到所述文档区域检测模型输出的n个检测角点坐标和检测分类概率,所述检测分类概率指示所述样本图像中包括文档区域的置信度,所述n个检测角点坐标指示所述样本图像中检测出的文档区域,所述n为大于或等于1的整数;>

5、根据所述m个标注角点坐标、所述标注类别、所述n个检测角点坐标和所述检测分类概率,对所述文档区域检测模型的参数进行调整。

6、在一种可能的实施方式中,所述将所述样本图像输入至文档区域检测模型,得到所述文档区域检测模型输出的n个检测角点坐标和检测分类概率,包括:

7、对所述样本图像进行特征提取处理,得到所述样本图像的高维特征;

8、对所述高维特征进行特征解码处理,得到所述高维特征对应的解码特征;

9、根据所述解码特征,得到所述n个检测角点坐标和所述检测分类概率。

10、在一种可能的实施方式中,所述对所述样本图像进行特征提取处理,得到所述样本图像的高维特征,包括:

11、对所述样本图像进行至少一次第一操作,得到第一特征,所述第一操作包括卷积操作和池化操作;

12、对所述第一特征进行特征筛选操作,得到筛选后的第二特征;

13、对所述第二特征进行至少一次第二操作,得到第三特征,所述第二操作包括卷积操作和池化操作;

14、对所述第三特征进行高维映射操作,得到所述高维特征。

15、在一种可能的实施方式中,所述对所述第一特征进行特征筛选操作,得到筛选后的第二特征,包括:

16、对所述第一特征执行k次第三操作,所述第三操作包括:对输入特征进行卷积操作,得到对应的卷积矩阵;根据所述卷积矩阵获取对应的输出特征;

17、对第k次第三操作的输出特征进行池化操作,得到所述第二特征;

18、其中,执行第一次第三操作的输入特征为所述第一特征,执行第i+1次第三操作的输入特征是执行第i次第三操作的输出特征,所述k为正整数,所述i为正整数。

19、在一种可能的实施方式中,所述根据所述卷积矩阵获取对应的输出特征,包括:

20、对所述卷积矩阵依次进行池化操作、卷积操作和归一化操作,获取对应的归一化向量;

21、根据所述卷积矩阵和所述归一化向量,获取所述输出特征。

22、在一种可能的实施方式中,所述根据所述解码特征,得到所述样本图像的检测分类概率和n个检测角点坐标,包括:

23、对所述解码特征进行第一特征映射操作,得到第一映射特征向量,所述第一映射特征向量中的元素包括所述检测分类概率;

24、对所述解码特征进行第二特征映射操作,得到第二映射特征向量,所述第二映射特征向量中包括n组元素,所述元素表示检测角点坐标。

25、在一种可能的实施方式中,所述根据所述m个标注角点坐标、所述标注类别、所述n个检测角点坐标和所述检测分类概率,对所述文档区域检测模型的参数进行调整,包括:

26、根据所述检测分类概率和所述标注类别,获取所述样本图像的分类损失;

27、根据所述n个检测角点坐标和所述m个标注角点坐标,获取所述样本图像的回归损失;

28、根据所述分类损失和所述回归损失,对所述文档区域检测模型的参数进行调整。

29、第二方面,本申请提供一种文档区域检测方法,包括:

30、获取待处理的第一图像;

31、将所述第一图像输入至文档区域检测模型,得到所述文档区域检测模型输出的p个角点坐标和分类概率,所述分类概率指示所述第一图像中是否存在文档区域,所述p个角点坐标指示所述第一图像中检测出的文档区域;其中,所述p为大于或等于1的整数,所述文档区域检测模型为根据第一方面任一项所述的方法训练得到的模型;

32、根据所述p个角点坐标和所述分类概率,获取所述第一图像的文档区域检测结果。

33、在一种可能的实施方式中,所述根据所述p个角点坐标和所述分类概率,获取所述第一图像的文档区域检测结果,包括:

34、若所述分类概率指示所述第一图像中不存在文档区域,则确定所述文档区域检测结果为所述第一图像中不包括文档区域;

35、若所述分类概率指示所述第一图像中存在文档区域,则将所述p个角点坐标围成的区域确定为所述第一图像中的文档区域。

36、第三方面,本申请提供一种文档区域检测模型训练装置,包括:

37、获取单元,用于获取训练样本,所述训练样本包括样本图像,以及所述样本图像的m个标注角点坐标和标注类别,所述m个标注角点坐标指示所述样本图像上的文档区域,所述标注类别指示所述样本图像上是否包括文档区域,所述m为大于或等于1的整数;

38、处理单元,用于将所述样本图像输入至文档区域检测模型,得到所述文档区域检测模型输出的n个检测角点坐标和检测分类概率,所述检测分类概率指示所述样本图像中包括文档区域的置信度,所述n个检测角点坐标指示所述样本图像中检测出的文档区域,所述n为大于或等于1的整数;

39、训练单元,用于根据所述m个标注角点坐标、所述标注类别、所述n个检测角点坐标和所述检测分类概率,对所述文档区域检测模型的参数进行调整。

40、在一种可能的实施方式中,所述处理单元具体用于:

41、对所述样本图像进行特征提取处理,得到所述样本图像的高维特征;

42、对所述高维特征进行特征解码处理,得到所述高维特征对应的解码特征;

43、根据所述解码特征,得到所述n个检测角点坐标和所述检测分类概率。

44、在一种可能的实施方式中,所述处理单元具体用于:

本文档来自技高网...

【技术保护点】

1.一种文档区域检测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述样本图像输入至文档区域检测模型,得到所述文档区域检测模型输出的N个检测角点坐标和检测分类概率,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述样本图像进行特征提取处理,得到所述样本图像的高维特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述第一特征进行特征筛选操作,得到筛选后的第二特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述卷积矩阵获取对应的输出特征,包括:

6.根据权利要求2-5任一项所述的方法,其特征在于,所述根据所述解码特征,得到所述N个检测角点坐标和所述检测分类概率,包括:

7.根据权利要求2-5任一项所述的方法,其特征在于,所述根据所述M个标注角点坐标、所述标注类别、所述N个检测角点坐标和所述检测分类概率,对所述文档区域检测模型的参数进行调整,包括:

8.一种文档区域检测方法,其特征在于,包括:

9.根据权利要求8所述的方法,其特征在于,所述根据所述P个角点坐标和所述分类概率,获取所述第一图像的文档区域检测结果,包括:

10.一种文档区域检测装置,其特征在于,包括:

...

【技术特征摘要】

1.一种文档区域检测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述样本图像输入至文档区域检测模型,得到所述文档区域检测模型输出的n个检测角点坐标和检测分类概率,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述样本图像进行特征提取处理,得到所述样本图像的高维特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述第一特征进行特征筛选操作,得到筛选后的第二特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述卷积矩阵获取对应的输出特征,包括:

【专利技术属性】
技术研发人员:程俊涛陈荣华
申请(专利权)人:珠海金山办公软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1