【技术实现步骤摘要】
基于特征提取的报表识别方法、装置、电子设备及介质
[0001]本专利技术涉及数据展示
,尤其涉及一种基于特征提取的报表识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]现有的数据管理方式一般采用报表的形式将数据进行录入,这种方式便于数据的查看和整理,也方便体现数据间的变化。在将数据进行录入过程中,通常需要识别报表,然而由于报表的样式各异、质量残次不齐,容易造成各种扫描后的报表图像在识别的过程中出现各种识别错误,导致报表识别的准确率不高。
技术实现思路
[0003]本专利技术提供一种基于特征提取的报表识别方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高报表识别的准确性。
[0004]为实现上述目的,本专利技术提供的一种基于特征提取的报表识别方法,包括:
[0005]获取报表图像的存储路径,根据所述存储路径获取所述报表图像,以及提取所述报表图像的图像特征;
[0006]根据所述图像特征确定所述报表图像的文本方向;
[0007]判断所述文本方向是
【技术保护点】
【技术特征摘要】
1.一种基于特征提取的报表识别方法,其特征在于,所述方法包括:获取报表图像的存储路径,根据所述存储路径获取所述报表图像,以及提取所述报表图像的图像特征;根据所述图像特征确定所述报表图像的文本方向;判断所述文本方向是否为预设方向;若是,确认所述报表图像为目标报表图像;若否,则将所述报表图像进行角度转换,得到所述目标报表图像;获取预训练的特征提取网络,利用所述特征提取网络提取所述目标报表图像的文本信息,得到目标文本。2.如权利要求1所述的基于特征提取的报表识别方法,其特征在于,所述根据所述存储路径获取所述报表图像,包括:从所述存储路径中获取所述报表图像的存储地址和存储流水号;在所述存储地址对应的数据库中查询所述存储流水号对应的报表图像是否唯一;若所述存储流水号对应的报表图像不唯一,则将所述存储流水号对应的报表图像舍弃,并再次获取所述获取报表图像的存储路径;若所述存储流水号对应的报表图像唯一,则根据所述存储地址获取所述报表图像。3.如权利要求1所述的基于特征提取的报表识别方法,其特征在于,所述提取所述报表图像的图像特征之前,所述方法还包括:获取所述报表图像,并对所述报表图像进行二值化操作,得到二值化报表图像;通过对所述二值化报表图像进行去噪,得到去噪报表图像;通过预设的直线检测法检测所述去噪报表图像的直线组,并对所述去噪报表图像的直线组进行直线补偿。4.如权利要求1所述的基于特征提取的报表识别方法,其特征在于,所述根据所述图像特征确定所述报表图像的文本方向,包括:将多个不同方向作为所述报表图像的预设文本方向,识别所述报表图像在所述多个不同方向的字符及其置信度;根据所述图像特征识别所述报表图像中的文本类别;对所述多个不同方向的字符中不属于所述报表图像的文本类别的字符的置信度按预设比例减小;统计在各个多个文本方向上的累积置信度,确定累计置信度最大时对应的文本方向为所述报表图像的文本方向。5.如权利要求1至4中任一项所述的基于特征提取的报表识别方法,其特征在于,所述获取预训练的特征提取网络,利用所述特征提取网络提取所述目标报表图像的文本信息,得到目标文本,包括:根据所述目标报表图像选取特征维度,根据所述特征维度对所述目标报表图像进行特征提取,得到报表特征;通过对所述报表特...
【专利技术属性】
技术研发人员:刘海怀,张灿豪,张杰,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。