【技术实现步骤摘要】
一种基于轻量级YOLO模型的财务报表检测方法
[0001]本专利技术属于图像识别
,具体涉及一种基于轻量级YOLO模型的财务报表检测方法。
技术介绍
[0002]OCR(Optical Character Recognition,光学字符识别)是指针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像文件中的文字转换成文本格式,送入文字处理软件进行进一步编辑加工的技术。目前,对于财务报表图像数据的提取一直以来都是OCR技术的难点,常规OCR识别算法只能对图像中的文字信息进行提取,并不能提取表格,无法识别表格和文字信息原来的格式,后续还需要利用人工来将文字信息填写到对应的位置,大大降低了工作效率。另外,现有通过常规OCR识别算法提取财务报表数据还经常会出现行列错位的情况。
技术实现思路
[0003]为了解决现有利用OCR识别算法提取财务报表数据存在的无法提取表格、无法识别表格和文字信息原来的格式、工作效率低的问题,本专利技术提供一种基于轻量级YOLO模型的财务报表检测方法。
[0004]本专利技术为解决技术问题所采用的技术方案如下:
[0005]本专利技术的一种基于轻量级YOLO模型的财务报表检测方法,包括以下步骤:
[0006]步骤一、对财务报表图像进行图像预处理;
[0007]步骤二、以图像预处理后的财务报表图像作为数据集,使用YOLO V4
‑
tiny模型训练数据集;选取待检测的财务报表图像进行测试,
【技术保护点】
【技术特征摘要】
1.一种基于轻量级YOLO模型的财务报表检测方法,其特征在于,包括以下步骤:步骤一、对财务报表图像进行图像预处理;步骤二、以图像预处理后的财务报表图像作为数据集,使用YOLOV4
‑
tiny模型训练数据集;选取待检测的财务报表图像进行测试,查验待检测的财务报表图像中的表格位置的识别是否准确,是否存在漏检误检的情况;步骤三、保存并调用YOLOV4
‑
tiny模型,将待检测的财务报表图像传入训练好的YOLOV4
‑
tiny模型进行预测,获取预测坐标;步骤四、利用步骤三所得预测坐标对待检测的财务报表图像的目标区域进行裁剪分块,裁剪分块后的图像按照顺序命名为Crop1、Crop2
……
CropN,同时记录对应的图像右下角坐标;步骤五、使用open
‑
cv对待检测的财务报表图像进行校验;步骤六、提取待检测的财务报表图像中表格的横线与竖线,并利用图像减运算计算表格中的横线与竖线的交点坐标,将表格中的横线与竖线的交点坐标与步骤四中的每个图像图像右下角坐标进行比对,判断裁剪分块后的图像中的表格位置是否正确;步骤七、将待检测的财务报表图像分为:规则型表格、多对一型表格和三线型表格;步骤八、根据步骤七判断的待检测的财务报表图像类型,将步骤四中裁剪分块后的图像分别利用OCR识别算法进行文字识别,识别后的文字信息按照步骤四中的坐标依次进行输出。2.根据权利要求1所述的一种基于轻量级YOLO模型的财务报表检测方法,其特征在于,步骤一的具体操作步骤如下:使用数据标注工具对财务报表图像中的各类单元格进行标记,财务报表图像标记数量为500张
‑
1000张,每一类单元格最少要对应标记150张财务报表图像。3.根据权利要求1所述的一种基于轻量级YOLO模型的财务报表检测方法,其特征在于,步骤二中,所述YOLO V4
‑
tiny模型读取财务报表图像的方法为单通道读取灰度图。4.根据权利要求1所述的一种基于轻量级YOLO模型的财务报表检测方法,其特征在于,步骤二中,将数据集划分为训练集与测试集,训练集与测试集的比例为3:7。5.根据权利要求1所述的一种基于轻量级YOLO模型的财务报表检测方法,其特征在于,步骤二中,训练结束后选择10张
‑
15张待检测的财务报表图像进行测试。6.根据权利要求1所述的一种基于轻量级YOLO模型的财务报表检测方法,其特征在于,步骤四中,图像信息与坐标信息字典格式为{
‘
Crop(裁剪的图像名...
【专利技术属性】
技术研发人员:杨玉东,赵爽,桂东昫,任昊,田庆阳,
申请(专利权)人:长春市万易科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。