一种基于图片序列识别的法院材料电子目录编排方法技术

技术编号:40611122 阅读:23 留言:0更新日期:2024-03-12 22:19
本发明专利技术公开了一种基于图片序列识别的法院材料电子目录编排方法,主要拆分编目工作,序列模型不仅仅使用单个图片信息提取首页,同时也使用了文本信息和前后文信息,再对首页使精心开发的标题抽取模型抽取标题。这样高了编目系统健壮性和效率。这个系统可以广泛应用于法院和类似领域,有望提高电子目录编排的质量和效率。

【技术实现步骤摘要】

本专利技术涉及目录编排技术,特别是一种基于图片序列识别的法院材料电子目录编排方法


技术介绍

1、在现代司法体系中,法院和相关机构面临着大量的文件和材料,这些材料需要经过仔细的目录编排,以确保它们能够快速、准确地被检索和管理。随着数字化信息的快速增长,电子目录编排系统变得尤为重要。传统上,这一过程主要依赖于基于图像识别的方法,试图自动识别和分类每一页的材料类型。

2、然而,传统的图像识别方法存在严重的限制。其中一个主要问题是分类的不准确性。当前方法通常依赖于静态的图像检测模型,这意味着当遇到新的、未知类别的材料标题时,系统容易出现错误。举例来说,一份材料包括劳动合同、户口本、工资条和借条。如果模型未正确识别户口本标题,后续户口本的子页面可能会被错误地归类到其他类别,导致编目的不准确。或者就需要加入很多规则来纠正页码编排的错误。

3、此外,当前方法通常是基于每个图片的独立识别,而忽略了材料内部的前后顺序关系。页码标记依赖于前一张图片的分类结果,这容易导致错误的传递和编目不准确。因此,有必要引入一种更高效、准确且具有自适应性的方法来改进本文档来自技高网...

【技术保护点】

1.一种基于图片序列识别的法院材料电子目录编排方法,其特征在于步骤包括:

2.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的序列模型为双向长短时记忆网络、单向的LSTM或者GRU模型。

3.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的步骤3)使用cnn提取图片的版面特征,再用bert提取文本特征。

4.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的步骤4)使用全连接层来学习融合后特征的表示,或是多模态模型提取多模态信息

5....

【技术特征摘要】

1.一种基于图片序列识别的法院材料电子目录编排方法,其特征在于步骤包括:

2.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的序列模型为双向长短时记忆网络、单向的lstm或者gru模型。

3.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的步骤3)使用cnn提取图片...

【专利技术属性】
技术研发人员:马楠
申请(专利权)人:南京通达海软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1