【技术实现步骤摘要】
本专利技术涉及目录编排技术,特别是一种基于图片序列识别的法院材料电子目录编排方法。
技术介绍
1、在现代司法体系中,法院和相关机构面临着大量的文件和材料,这些材料需要经过仔细的目录编排,以确保它们能够快速、准确地被检索和管理。随着数字化信息的快速增长,电子目录编排系统变得尤为重要。传统上,这一过程主要依赖于基于图像识别的方法,试图自动识别和分类每一页的材料类型。
2、然而,传统的图像识别方法存在严重的限制。其中一个主要问题是分类的不准确性。当前方法通常依赖于静态的图像检测模型,这意味着当遇到新的、未知类别的材料标题时,系统容易出现错误。举例来说,一份材料包括劳动合同、户口本、工资条和借条。如果模型未正确识别户口本标题,后续户口本的子页面可能会被错误地归类到其他类别,导致编目的不准确。或者就需要加入很多规则来纠正页码编排的错误。
3、此外,当前方法通常是基于每个图片的独立识别,而忽略了材料内部的前后顺序关系。页码标记依赖于前一张图片的分类结果,这容易导致错误的传递和编目不准确。因此,有必要引入一种更高效、准确且具有
...【技术保护点】
1.一种基于图片序列识别的法院材料电子目录编排方法,其特征在于步骤包括:
2.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的序列模型为双向长短时记忆网络、单向的LSTM或者GRU模型。
3.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的步骤3)使用cnn提取图片的版面特征,再用bert提取文本特征。
4.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的步骤4)使用全连接层来学习融合后特征的表示,或是多模态模型提取多模态信息
5....
【技术特征摘要】
1.一种基于图片序列识别的法院材料电子目录编排方法,其特征在于步骤包括:
2.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的序列模型为双向长短时记忆网络、单向的lstm或者gru模型。
3.根据权利要求1所述的一种基于图片序列识别的法院材料电子目录编排方法,其特征在于所述的步骤3)使用cnn提取图片...
【专利技术属性】
技术研发人员:马楠,
申请(专利权)人:南京通达海软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。