基于深度学习的电子文档中标题印章指纹特征检测方法技术

技术编号：25087893 阅读：27 留言：0更新日期：2020-07-31 23:32

本发明专利技术公开了一种基于深度学习的电子文档中标题印章指纹特征检测方法，包括：对电子文档图片按比例进行手工标注作为训练集，其余作为测试集；搭建并训练集训练Faster‑RCNN模型；将测试集输入训练好的Faster‑RCNN模型预测目标类别和坐标，对测试集进行自动标注，形成标注数据集；采用标注数据集对Faster‑RCNN模型进行迭代训练，导出最终的Faster‑RCNN模型的模型参数，输入电子文档图片，得到电子文档中标题印章指纹信息。本发明专利技术采用多次修改模型参数和迭代训练的方法，将基于深度学习的目标检测用于传统的案件电子卷宗文档处理领域后，极大方便了文档处理；采用半自动化标注，节约了人力。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的电子文档中标题印章指纹特征检测方法
本专利技术涉及电子文档处理
，具体的说，是一种基于深度学习的电子文档中标题印章指纹特征检测方法。
技术介绍
当今社会是信息社会，信息资源已经成为当今社会重要的战略资源之一。信息资源的利用和开发水平已经成为推动经济、文化、科技和社会发展的重要动力。在司法领域，很多卷宗都是由自由文本的形式处理，识别文档中的字符目标和图像中的关键的图像图形，比如标题，印章，指纹等，目前主要依靠人工来观察，其效率低，消耗大，不利于提高文案处理效率。
技术实现思路
本专利技术的目的在于提供一种基于深度学习的电子文档中标题印章指纹特征检测方法，用于解决现有技术中依靠人工识别文档中的标题印章指纹特征效率低下的问题。本专利技术通过下述技术方案解决上述问题：一种基于深度学习的电子文档中标题印章指纹特征检测方法，包括：步骤S100：对电子文档图片按照预设比例进行手工标注，这部分数据作为训练集，其余部分作为测试集；步骤S200：搭建Faster-RCNN模型，采用训练集训练Faster-RCNN模型；步骤S300：将测试集输入训练好的Faster-RCNN模型预测目标类别和坐标，对测试集进行自动标注，形成标注数据集；步骤S400：采用标注数据集对Faster-RCNN模型进行迭代训练，直到Faster-RCNN输出的目标类别和坐标准确为止；步骤S500：导出最终的Faster-RCNN模型的模型参数，输入电子文档图片，得到电...

【技术保护点】
1.一种基于深度学习的电子文档中标题印章指纹特征检测方法，其特征在于，包括：/n步骤S100：对电子文档图片按照预设比例进行手工标注，这部分数据作为训练集，其余部分作为测试集；/n步骤S200：搭建Faster-RCNN模型，采用训练集训练Faster-RCNN模型；/n步骤S300：将测试集输入训练好的Faster-RCNN模型预测目标类别和坐标，对测试集进行自动标注，形成标注数据集；/n步骤S400：采用标注数据集对Faster-RCNN模型进行迭代训练，直到Faster-RCNN输出的目标类别和坐标准确为止；/n步骤S500：导出最终的Faster-RCNN模型的模型参数，输入电子文档图片，得到电子文档中标题印章指纹信息。/n

【技术特征摘要】
1.一种基于深度学习的电子文档中标题印章指纹特征检测方法，其特征在于，包括：
步骤S100：对电子文档图片按照预设比例进行手工标注，这部分数据作为训练集，其余部分作为测试集；
步骤S200：搭建Faster-RCNN模型，采用训练集训练Faster-RCNN模型；
步骤S300：将测试集输入训练好的Faster-RCNN模型预测目标类别和坐标，对测试集进行自动标注，形成标注数据集；
步骤S400：采用标注数据集对Faster-RCNN模型进行迭代训练，直到Faster-RCNN输出的目标类别和坐标准确为止；
步骤S500：导出最终的Faster-RCNN模型的模型参数，输入电子文档图片，得到电子文档中标题印章指纹信息。

2.根据权利要求1所述的基于深度学习的电子文档中标题印章指纹特征检测方法，其特征在于，所述步骤S200具体包括：
步骤S210：迁移采用ImageNet数据预训练的模型数据，对Faster-RCNN模型参数进行初始化；
步骤S220：将训练集输入Faster-RCNN模型，得到目标类别和坐标，将得到的目标类别和坐标...

【专利技术属性】
技术研发人员：蒋翱，魏明欣，张兵，李丹，钟夫，
申请(专利权)人：同方赛威讯信息技术有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人