【技术实现步骤摘要】
数据处理方法和装置
[0001]本申请涉及数字文档分析
,尤其涉及一种数据处理方法和装置。
技术介绍
[0002]近年来,文档识别技术飞速发展,很多文档中嵌有各种公式,因此,文档的公式识别也是文档识别中一个重要的组成部分。由于公式的结构要远比文本复杂,文档的公式识别已成为文档识别的难点问题。
[0003]但是,公式中往往会存在上下标关系等细粒度信息,如何准确地识别公式中的细粒度信息是一个技术难点。
技术实现思路
[0004]本申请提供一种数据处理方法和装置,以准确地识别公式中的细粒度信息。
[0005]第一方面,本申请提供一种数据处理方法,包括:
[0006]获取原始图像。
[0007]根据预配置的图像尺度空间,对原始图像进行填充处理,获得填充处理图像,以使填充处理图像尺度归一化。
[0008]对填充处理图像,进行插值降采样处理,获得细节信息增益的插值降采样处理图像。
[0009]根据细粒度全局特征提取网络模型,提取插值降采样处理图像的特征。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取原始图像;根据预配置的图像尺度空间,对所述原始图像进行填充处理,获得填充处理图像,以使所述填充处理图像尺度归一化;对所述填充处理图像,进行插值降采样处理,获得细节信息增益的插值降采样处理图像;根据细粒度全局特征提取网络模型,提取所述插值降采样处理图像的特征;采用编码器对所述特征进行编码处理,并采用基于注意力机制的解码器,对编码处理后的所述特征进行解码处理,获得所述原始图像中的公式识别结果。2.根据权利要求1所述的方法,其特征在于,所述细粒度全局特征提取网络模型至少包括卷积层、池化层以及批归一化层,所述池化层采用n
×
m和m
×
n两个非对称池化层,n为大于等于2的整数,m为大于等于1的整数。3.根据权利要求1所述的方法,其特征在于,所述采用基于注意力机制的解码器,对编码处理后的所述特征进行解码处理,包括:根据编码处理过程的最终隐状态,获得全局融合隐状态;将所述全局融合隐状态作为所述解码器的初始隐状态,采用基于注意力机制的所述解码器,对编码处理后的所述特征进行解码处理;其中,所述全局融合隐状态包括:编码器全局隐状态的均值,或者,编码器各行最终隐状态的均值。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述预配置的图像尺度空间包括多个图像分组尺寸,所述根据预配置的图像尺度空间,对所述原始图像进行填充处理,获得填充处理图像,以使所述填充处理图像尺度归一化,包括:根据所述原始图像的尺寸,从预配置的图像尺度空间中确定最接近所述原始图像的尺寸的图像分组尺寸;根据确定的图像分组尺寸,对所述原始图像进行填充处理,获得填充处理图像,其中,所述填充处理图像的尺寸等于所述确定的图像分组尺寸,以使所述填充处理图像尺度归一化。5.根据权利要求4所述的方法,其特征在于,所述根据预配置的图像尺度空间,对所述原始图像进行填充处理,获得填充处理图像,以使所述填充处理图像尺度归一化之前,还包括:分别根据预设的多种聚类维度,对多张不同的原始图像进行聚类处理,获得所...
【专利技术属性】
技术研发人员:陈一帆,颜钦钦,
申请(专利权)人:北大方正信息产业集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。