文本关系检测、模型的训练方法、装置、设备及介质制造方法及图纸

技术编号:37674999 阅读:21 留言:0更新日期:2023-05-26 04:39
本公开提供了一种文本关系检测、模型的训练方法、装置、设备及介质,涉及人工智能领域,具体涉及深度学习和图像处理领域等。具体实现方案为:对文本图像进行特征提取,得到文本特征;根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别;采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系。本公开实施例可以提高文本关系检测准确性。性。性。

【技术实现步骤摘要】
文本关系检测、模型的训练方法、装置、设备及介质


[0001]本公开涉及人工智能领域,具体涉及深度学习和图像处理领域,尤其涉及一种文本关系检测、模型的训练方法、装置、设备及介质。

技术介绍

[0002]目前采用结构化文档表示信息,可以清晰展示用户的信息。
[0003]获取这些结构化信息有助于了解用户的基本状况,并进行针对性的分析和处理,同时可以建立完善的数据库和用户画像。

技术实现思路

[0004]本公开提供了一种文本关系检测、模型的训练方法、装置、设备及介质。
[0005]根据本公开的一方面,提供了一种文本关系检测方法,包括:
[0006]对文本图像进行特征提取,得到文本特征;
[0007]根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别;
[0008]采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系。
[0009]根据本公开的另一方面,提供了一种文本关系检测模型的训练方法,包本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本关系检测方法,包括:对文本图像进行特征提取,得到文本特征;根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别;采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系。2.根据权利要求1所述的方法,其中,所述结构关系,包括:至少一个方向上的结构关系。3.根据权利要求2所述的方法,其中,所述文本结构关系类别包括非固定方向关系类别;所述采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系,包括:采用与所述非固定方向关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中每个文本区域与各所述文本区域之间是否存在结构关系的概率。4.根据权利要求2所述的方法,其中,所述文本结构关系类别包括固定方向关系类别,所述结构关系包括行方向上结构关系和列方向上结构关系;所述采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系,包括:采用与所述固定方向关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中每个文本区域与各所述文本区域之间是否存在行方向上结构关系的概率,以及所述文本图像中每个文本区域与各所述文本区域之间是否存在列方向上结构关系的概率。5.根据权利要求1所述的方法,其中,所述采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系,包括:采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到多个备选区域之间的结构关系;对所述文本特征进行文本检测,得到备选区域在所述文本图像中的位置和置信度;根据各所述备选区域在所述文本图像中的位置和置信度,在多个备选区域之间的结构关系中,筛选出多个文本区域之间的结构关系。6.根据权利要求5所述的方法,还包括:根据各所述备选区域在所述文本图像中的位置和置信度,在所述文本图像中,获取各所述文本区域的位置处的区域图像;对所述区域图像进行文本识别,得到所述区域图像对应的文本内容;根据所述文本图像中多个文本区域之间的结构关系,和所述区域图像对应的文本内容,生成所述文本图像对应的结构化文本。7.根据权利要求1所述的方法,其中,所述对文本图像进行特征提取,得到文本特征,包括:通过文本关系检测模型中特征提取层,对文本图像进行特征提取,得到文本特征;
所述根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别,包括:通过所述文本关系检测模型中分类层,根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别;所述采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系,包括:通过所述文本关系检测模型中采用与所述文本图像的文本结构关系类别对应的检测层,对所述文本特征进行文本关系检测,得到所述文本图像中多个文本区域之间的结构关系。8.一种文本关系检测模型的训练方法,包括:获取训练样本,所述训练样本包括样本图像和所述样本图像包括的标准文本区域之间的标准结构关系;通过初始模型中特征提取层,对所述样本图像进行特征提取,得到样本特征;通过所述初始模型中分类层,根据所述样本特征根据所述样本特征对所述样本图像进行分类,得到所述样本图像的文本结构关系类别;通过所述初始模型中采用与所述样本图像的文本结构关系类别对应的检测层,采用与所述样本图像的文本结构关系类别对应的检测方式,对所述样本特征进行文本关系检测,得到所述样本图像中多个文本区域之间的结构关系;根据所述样本图像中多个文本区域之间的结构关系,和所述标准文本区域之间的标准结构关系之间的差异,对所述初始模型进行训练,得到文本关系检测模型。9.一种文本关系检测装置,包括:特征提取模块,用于对文本图像进行特征提取,得到文本特征;图像分类模块,用于根据所述文本特征对所述文本图像进行分类,得到所述文本图像的文本结构关系类别;结构关系检测模块,用于采用与所述文本图像的文本结构关系类别对应的检测方式,对所述文本特...

【专利技术属性】
技术研发人员:于海鹏李煜林钦夏孟姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1