【技术实现步骤摘要】
图片类案卷材料的采集方法
本专利技术涉及电子政务
,特别是一种政府执法部门如何充分发挥执法数据应用效能的采集方法。
技术介绍
政府执法部门行使着由国家赋予的执法权利,担负着维持社会稳定,维护法制精神的职责,是实现依法治国的重要组成部分。在对执法规范、执法效率、执法廉洁等各个方向上的探索与尝试,都反映出各执法部门对信息化建设的重视程度。如何充分借助科技力量,为执法活动提供有效支撑,是信息化建设的关键,这一定程度上取决于对执法活动数据化处理的深度。近年来随着经济的发展、社会的进步,越来越多的执法部门愈加重视执法的规范化。其中,能否更有效的实现对案卷材料的信息化管理与应用,是解决执法规范化管理的关键所在。这在相关的执法领域中,已经开始得到关注,但现阶段仍处于起步探索的过程,缺乏一个完整的、成熟的、可复制的整体解决方案。在实现对案卷材料的信息化管理与应用的过程中,其主要难点在于:1)当前执法部门的业务开展并未完全实现信息化,处于信息化建设的中间过渡期,在实际的执法办案过程中,仍然存在大量的非结构化案卷材料需要采集,由于 ...
【技术保护点】
1.图片类案卷材料的采集方法,其特征在于,包括以下步骤:/nA.根据所提供的用户交互页面,依照页面的操作向导,上传需要采集的图片类案卷材料;/nB.对步骤A上传的图片类案卷材料进行数据预处理,通过结合系统后台自动化数据整理以及人工数据整理的半自动化数据整理方式,依据一组特定的基于采集规范预设的规则,整理好案卷材料数据以及其他采集信息数据;/nC.在步骤B通过结合自动化与人工的方式完成对采集数据的整理后,按照设计好的数据模型,对在步骤B中整理好的临时数据集进行整合、组织,得到结果数据;/nD.将步骤C中加工好的结果数据,存储到数据库。/n
【技术特征摘要】
1.图片类案卷材料的采集方法,其特征在于,包括以下步骤:
A.根据所提供的用户交互页面,依照页面的操作向导,上传需要采集的图片类案卷材料;
B.对步骤A上传的图片类案卷材料进行数据预处理,通过结合系统后台自动化数据整理以及人工数据整理的半自动化数据整理方式,依据一组特定的基于采集规范预设的规则,整理好案卷材料数据以及其他采集信息数据;
C.在步骤B通过结合自动化与人工的方式完成对采集数据的整理后,按照设计好的数据模型,对在步骤B中整理好的临时数据集进行整合、组织,得到结果数据;
D.将步骤C中加工好的结果数据,存储到数据库。
2.根据权利要求1所述的图片类案卷材料采集方法,其特征在于,所述步骤B包括以下具体步骤:
B1.为所有上传的图片类案卷材料文件创建唯一标识,建立图片文件与唯一标识的映射;
B2.将图片文件的内容以字节流的形式与图片文件对应的由步骤B1创建的唯一标识一并传入后台;
B3.后台接收到传入的数据后,将图片文件内容的字节流数据转化为三阶张量;
B4.调用光学字符识别服务提供的接口,将步骤B3得到的三阶张量传入,得到服务返回的识别结果;
B5.在步骤B4得到光学字符识别服务返回的识别结果后,根据一组特定的基于采集规范预设的规则,自动化整理数据;
B6.判断自动化整理数据是否已符合采集的要求,如果满足,则直接进行B8步骤;否则,可先进行B7步骤;
B7.根据案卷材料采集规范的要求,对需要采集的案卷材料以及其他采集信息进行人工整理,完成后进行B8步骤;
B8.将经过半自动化整理的临时数据集提交至后台。
3.根据权利要求2所述的图片类案卷材料采集方法,其特征在于,所述光学字符识别服务,是一组基于深度学习网络所构建的模型,并封装成一组基于web架构的、可供外部调用的接口,为外部提供服务。
4.根据权利要求3所述的图片类案卷材料采集方法,其特征在于,所述基于深度学习网络构建的模型,主要实现了基于CTPN网络的文本检测模型、基于GAN对抗网络的超分辨率模型、基于CRNN的文字识别模型,其中:
文本检测模型用于检测图片文件出现文字的区域,便于后续做图片切割处理;
超分辨率模型用于解决因图片质...
【专利技术属性】
技术研发人员:苏学武,刘怀春,孔洋,陈继良,吴海平,
申请(专利权)人:珠海市新德汇信息技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。