基于图片对比的自动化测试方法、装置、设备及存储介质制造方法及图纸

技术编号:37243556 阅读:24 留言:0更新日期:2023-04-20 23:24
本申请公开了一种基于图片对比的自动化测试方法、装置、设备及存储介质。所述方法包括:将原始图片数据导入图片库,定义原始图片数据的关键字段替换区域以及随机替换字段;采用随机替换字段对关键字段替换区域中的关键字段进行随机替换,生成替换后的图片数据;使用替换后的图片数据调用OCR测试接口对OCR图片识别系统进行测试,并获取OCR测试接口的实际返回数据,实际返回数据中包括替换后的图片数据中各个关键字段的对应字段以及各个关键字段对应的值;对替换后的图片数据与实际返回数据进行匹配对比,获取替换后的图片数据的字段匹配成功率及字段识别准确率,得到OCR图片识别系统的测试结果。本申请实施例大大提高了对OCR图片识别系统的测试效率。对OCR图片识别系统的测试效率。对OCR图片识别系统的测试效率。

【技术实现步骤摘要】
基于图片对比的自动化测试方法、装置、设备及存储介质


[0001]本申请涉及图像处理
,特别是涉及一种基于图片对比的自动化测试方法、装置、设备及存储介质。

技术介绍

[0002]作为保险业务的重要环节,理赔往往是人力投入最为密集的环节。以健康险理赔为例,从报案、立案、核赔到复核,每一环节都需要大量人力从事资料信息录入等事务性工作。其中,医疗票据作为最核心的理算依据,需要录入的项目繁多、类目复杂,且难以保证录入信息的完整性和准确度。为了解决该不足,以深度学习和图像识别技术为基础的图像识别系统通过OCR(光学字符识别(Optical Character Recognition))+专项数据训练+机器学习文字抽取等方法训练算法模型,可自动录入票面文字信息、医疗票据类型等各类理算信息的识别,实现理赔录入自动化。针对该系统的测试方式为:采用人工对比的方式对比系统处理后的返回值和图片内容,无法采用自动化测试的方式进行测试,花费时间较长,测试效率较低,并且很多测试内容因人力资源的限制,无法开展大规模的测试,难以评估OCR图像识别系统的识别准确性。

技术实现思路

[0003]本申请提供了一种基于图片对比的自动化测试方法、装置、设备及存储介质,旨在解决现有的图像识别系统测试方式存在的花费时间较长、测试效率较低、难以评估图像识别系统识别准确性的技术问题。
[0004]为解决上述技术问题,本申请采用的技术方案为:
[0005]一种基于图片对比的自动化测试方法,包括:
[0006]将原始图片数据导入图片库,定义所述原始图片数据的关键字段替换区域以及随机替换字段;
[0007]采用所述随机替换字段对所述关键字段替换区域中的关键字段进行随机替换,生成替换后的图片数据;
[0008]使用所述替换后的图片数据调用OCR测试接口对所述OCR图片识别系统进行测试,并获取所述OCR测试接口的实际返回数据,所述实际返回数据中包括所述替换后的图片数据中各个关键字段的对应字段以及各个关键字段对应的值;
[0009]对所述替换后的图片数据与实际返回数据进行匹配对比,获取所述替换后的图片数据的字段匹配成功率及字段识别准确率,得到OCR图片识别系统的测试结果。
[0010]本申请实施例采取的技术方案还包括:所述将原始图片数据导入图片库之后,还包括:
[0011]设置每张原始图片数据的图片信息,所述图片信息包括图片名称、自定义标签及图片类型;
[0012]所述定义所述原始图片数据的关键字段替换区域以及随机替换字段之后,还包
括:
[0013]建立所述原始图片数据中各个关键字段与所述OCR图片识别系统进行图片识别后的实际返回数据的字段之间的映射关系,使得所述原始图片数据中的各个关键字段与实际返回数据中的字段一一对应,并将所述映射关系存放至比对配置表中。
[0014]本申请实施例采取的技术方案还包括:所述采用所述随机替换字段对所述关键字段替换区域中的关键字段进行随机替换,生成替换后的图片数据具体为:
[0015]通过所述OCR图片识别系统从所述图片库中选取原始图片数据,并根据所选取的原始图片数据触发执行OCR图片识别系统的自动化测试;
[0016]采用所述随机替换字段对所述选取的原始图片数据中的关键字段替换区域进行关键字段替换,生成字段替换后的区域图片;
[0017]获取所述选取的原始图片数据对应的模板图片,并将字段替换后的区域图片覆盖在所述模板图片的对应位置区域中,生成替换后的图片数据;其中,所述模板图片为与所述选取的原始图片数据的格式及类型一致的图片。
[0018]本申请实施例采取的技术方案还包括:所述获取所述OCR测试接口的实际返回数据之后,还包括:
[0019]解析所述OCR测试接口返回的实际返回数据,对所述实际返回数据进行实例化后,将对应的所述替换后的图片数据的图片信息存储在mysql表中,建立所述替换后的图片数据与所述实际返回数据的关联关系,并对所述实际返回数据进行持久化处理。
[0020]本申请实施例采取的技术方案还包括:所述对所述替换后的图片数据与实际返回数据进行匹配对比,获取所述替换后的图片数据的字段匹配成功率及字段识别准确率,得到OCR图片识别系统的测试结果具体为:
[0021]从所述比对配置表中获取所述关键字段与实际返回数据中各字段之间的映射关系,根据所述映射关系对所述替换后的图片数据的关键字段与所述实际返回数据中的字段进行匹配,如果字段匹配失败,则表示所述关键字段为识别错误,如果字段匹配成功,则将所述关键字段的值与所述实际返回数据中对应字段的值进行对比,根据对比结果得到所述替换后的图片数据的字段匹配成功率及字段识别准确率。
[0022]本申请实施例采取的技术方案还包括:所述对所述替换后的图片数据与实际返回数据进行匹配对比,获取所述替换后的图片数据的字段匹配成功率及字段识别准确率,得到OCR图片识别系统的测试结果之后还包括:
[0023]采用图形化html格式输出所述OCR图片识别系统的测试结果,所述测试结果中包括所述OCR图片识别系统的图片识别数量、字段识别数量、匹配成功的字段数量、字段匹配成功率以及字段识别准确率。
[0024]本申请实施例采取的另一技术方案为:一种基于图片对比的自动化测试装置,包括:
[0025]数据导入模块:用于将原始图片数据导入图片库,定义所述原始图片数据的关键字段替换区域以及随机替换字段;
[0026]数据替换模块:用于采用所述随机替换字段对所述关键字段替换区域中的关键字段进行随机替换,生成替换后的图片数据;
[0027]OCR测试模块:用于使用所述替换后的图片数据调用OCR测试接口对所述OCR图片
识别系统进行测试,并获取所述OCR测试接口的实际返回数据,所述实际返回数据中包括所述替换后的图片数据中各个关键字段的对应字段以及各个关键字段对应的值;
[0028]数据匹配模块:用于对所述替换后的图片数据与实际返回数据进行匹配对比,获取所述替换后的图片数据的字段匹配成功率及字段识别准确率,得到OCR图片识别系统的测试结果。
[0029]本申请实施例采取的技术方案还包括:所述数据替换模块采用所述随机替换字段对所述关键字段替换区域中的关键字段进行随机替换,生成替换后的图片数据具体为:
[0030]通过所述OCR图片识别系统从所述图片库中选取原始图片数据,并根据所选取的原始图片数据触发执行OCR图片识别系统的自动化测试;
[0031]采用所述随机替换字段对所述选取的原始图片数据中的关键字段替换区域进行关键字段替换,生成字段替换后的区域图片;
[0032]获取所述选取的原始图片数据对应的模板图片,并将字段替换后的区域图片覆盖在所述模板图片的对应位置区域中,生成替换后的图片数据;其中,所述模板图片为与所述选取的原始图片数据的格式及类型一致的图片。
[0033]本申请实施例采取的又一技术方案为:一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图片对比的自动化测试方法,其特征在于,包括:将原始图片数据导入图片库,定义所述原始图片数据的关键字段替换区域以及随机替换字段;采用所述随机替换字段对所述关键字段替换区域中的关键字段进行随机替换,生成替换后的图片数据;使用所述替换后的图片数据调用OCR测试接口对所述OCR图片识别系统进行测试,并获取所述OCR测试接口的实际返回数据,所述实际返回数据中包括所述替换后的图片数据中各个关键字段的对应字段以及各个关键字段对应的值;对所述替换后的图片数据与实际返回数据进行匹配对比,获取所述替换后的图片数据的字段匹配成功率及字段识别准确率,得到OCR图片识别系统的测试结果。2.根据权利要求1所述的基于图片对比的自动化测试方法,其特征在于,所述将原始图片数据导入图片库之后,还包括:设置每张原始图片数据的图片信息,所述图片信息包括图片名称、自定义标签及图片类型;所述定义所述原始图片数据的关键字段替换区域以及随机替换字段之后,还包括:建立所述原始图片数据中各个关键字段与所述OCR图片识别系统进行图片识别后的实际返回数据的字段之间的映射关系,使得所述原始图片数据中的各个关键字段与实际返回数据中的字段一一对应,并将所述映射关系存放至比对配置表中。3.根据权利要求2所述的基于图片对比的自动化测试方法,其特征在于,所述采用所述随机替换字段对所述关键字段替换区域中的关键字段进行随机替换,生成替换后的图片数据具体为:通过所述OCR图片识别系统从所述图片库中选取原始图片数据,并根据所选取的原始图片数据触发执行OCR图片识别系统的自动化测试;采用所述随机替换字段对所述选取的原始图片数据中的关键字段替换区域进行关键字段替换,生成字段替换后的区域图片;获取所述选取的原始图片数据对应的模板图片,并将字段替换后的区域图片覆盖在所述模板图片的对应位置区域中,生成替换后的图片数据;其中,所述模板图片为与所述选取的原始图片数据的格式及类型一致的图片。4.根据权利要求1至3任一项所述的基于图片对比的自动化测试方法,其特征在于,所述获取所述OCR测试接口的实际返回数据之后,还包括:解析所述OCR测试接口返回的实际返回数据,对所述实际返回数据进行实例化后,将对应的所述替换后的图片数据的图片信息存储在mysql表中,建立所述替换后的图片数据与所述实际返回数据的关联关系,并对所述实际返回数据进行持久化处理。5.根据权利要求4所述的基于图片对比的自动化测试方法,其特征在于,所述对所述替换后的图片数据与实际返回数据进行匹配对比,获取所述替换后的图片数据的字段匹配成功率及字段识别准确率,得到OCR图片识别系统的测试结果具体为:从所述比对配置表中获取所述关键字段与实际返回数据中各字段之间的映射关系,根据所述映射关系对所述替换后的图片数据...

【专利技术属性】
技术研发人员:胡春辉
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1