一种基于文件格式自适应的不动产电子证照管理系统技术方案

技术编号:31980709 阅读:17 留言:0更新日期:2022-01-20 01:37
本发明专利技术涉及一种基于文件格式自适应的不动产电子证照管理系统,包括:文件接收模块,所述文件接收模块用于接收文件;文件格式自适应模块,所述文件接收模块将接收到的文件传递给所述文件格式自适应模块;签章模块,所述文件格式自适应模块将生成的新的电子证照文件传递给所述签章模块;存储模块,所述存储模块用于接收签章模块的电子证照文件和电子签章文件。本发明专利技术的一种基于文件格式自适应的不动产电子证照管理系统通过深度神经网络进行内容关键信息提取,将其统一融合后,能够提高准确率和效率,从不同格式的文件内容中提取出不动产单元、证书序号内容等不动产电子证照关键信息,不需人工阅读和录入数据,提高了工作效率。提高了工作效率。提高了工作效率。

【技术实现步骤摘要】
一种基于文件格式自适应的不动产电子证照管理系统


[0001]本专利技术涉及管理系统
,尤其是指一种基于文件格式自适应的不动产电子证照管理系统。

技术介绍

[0002]不动产登记作为日常业务量巨大的政府服务窗口,在服务百姓和优化营商环境起着重要的作用,同时也是评价城市营商环境的重要指标。
[0003]目前政务部门在工作中需要对办理业务的证明材料如身份证、户口本等进行采集并数字化存储,而在采集过程中,由于采集设备、采集软件、采集方法的不同,容易导致采集得到的文件格式不一致的问题,导致电子证照后续处理过程较为复杂,影响了政务办事效率。

技术实现思路

[0004]为此,本专利技术所要解决的技术问题在于克服现有技术中由于采集设备、采集软件、采集方法的不同,导致采集得到的文件格式不一致,使得政务办事效率降低的问题,并提供一种处理效率高的基于文件格式自适应的不动产电子证照管理系统。
[0005]为解决上述技术问题,本专利技术提供了一种基于文件格式自适应的不动产电子证照管理系统,包括:
[0006]文件接收模块,所述文件接收模块用于接收文件;
[0007]文件格式自适应模块,所述文件接收模块将接收到的文件传递给所述文件格式自适应模块,所述文件格式自适应模块生成新的电子证照文件;
[0008]签章模块,所述文件格式自适应模块将生成的新的电子证照文件传递给所述签章模块,所述签章模块用于生成对应的电子签章文件;
[0009]存储模块,所述存储模块用于接收签章模块的电子证照文件和电子签章文件,并存储相关信息。
[0010]作为本专利技术的进一步改进,所述文件接收模块通过REST接口形式接收文件。
[0011]作为本专利技术的进一步改进,所述文件格式自适应模块对于Microsoft Office Word格式文件,采用ApachePOI读取文件中内容,通过使用端对端神经网络模型对文件中内容进行提取,其中,ApachePOI是一个解析Microsoft Documents的Java程序库。
[0012]作为本专利技术的进一步改进,所述文件格式自适应模块对于PDF格式文件,采用itextpdf方法读取文件中内容,通过使用端对端神经网络模型对文件中内容进行提取,其中,itextpdf是一个解析PDF文件的Java程序库。
[0013]作为本专利技术的进一步改进,所述端对端神经网络模型利用ResNet+FPN作为骨干网络进行文字检测,利用检测网络和ROIAlign算法的结果进行attention+encoder

decoder的文字识别,将文本位置信息、视觉信息、语义信息进行融合,并通过BiLSTM进行IOB标签分类以得到文档关键信息,其中attention为注意力机制,encoder为编码器,decoder为解码
器。
[0014]作为本专利技术的进一步改进,端对端神经网络模型对文本检测、文本识别、信息提取三个任务进行共同优化学习,其损失函数为:
[0015][0016]其中,λ
recog
和λ
info
为平衡系数,为文本检测任务的损失函数,包括一个分类损失函数和一个回归损失函数。
[0017]作为本专利技术的进一步改进,文本识别损失函数和信息提取损失函数分别定义如下:
[0018][0019][0020]其中,为来自识别任务的第i个文本中第t个字符的真实标签,是其对应的信息提取标签。
[0021]作为本专利技术的进一步改进,文本检测和文本识别组合成文本阅读任务,通过统一的端对端文本阅读和信息提取网络将文本阅读的多模态视觉和文本特征融合到信息提取中。
[0022]作为本专利技术的进一步改进,所述签章模块利用SHA

256算法计算电子证照文件的HASH值,并通过RSA算法使用私钥对计算得到的HASH值进行签名,最终生成对应的电子签章文件。
[0023]作为本专利技术的进一步改进,所述相关信息为所述存储模块接收到所述签章模块的电子证照文件和电子签章文件后,根据不动产所有权、不动产单元、证书序号数据规范对证照提取特征,并进行排序和编码形成的一组信息,将该组信息存储在数据库中。
[0024]本专利技术的上述技术方案相比现有技术具有以下优点:
[0025]本专利技术的一种基于文件格式自适应的不动产电子证照管理系统通过深度神经网络进行内容关键信息提取,将其统一融合后,能够提高准确率和效率,从不同格式的文件内容中提取出不动产单元、证书序号内容等不动产电子证照关键信息,不需人工阅读和录入数据,提高了工作效率的同时,减少了因人工录入错误导致的后续问题。
附图说明
[0026]为了使本专利技术的内容更容易被清楚的理解,下面根据本专利技术的具体实施例并结合附图,对本专利技术作进一步详细的说明,其中:
[0027]图1是本专利技术优选实施例中基于文件格式自适应的不动产电子证照管理系统的架构图。
具体实施方式
[0028]下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。
[0029]在一些实施例中,参照图1所示,本专利技术的一种基于文件格式自适应的不动产电子
证照管理系统,包括:
[0030]文件接收模块,文件接收模块用于接收文件;
[0031]文件格式自适应模块,文件接收模块将接收到的文件传递给文件格式自适应模块,文件格式自适应模块生成新的电子证照文件;
[0032]签章模块,文件格式自适应模块将生成的新的电子证照文件传递给签章模块,签章模块用于生成对应的电子签章文件;
[0033]存储模块,存储模块用于接收签章模块的电子证照文件和电子签章文件,并存储相关信息。
[0034]文件接收模块接收到文件后,将其传递给文件格式自适应模块,文件格式自适应模块生成新的电子证照文件,并将该电子证照文件传递给签章模块,签章模块生成对应的电子签章文件,存储模块接收签章模块的电子证照文件和电子签章文件,并存储相关信息。
[0035]在一些实施例中,参照图1所示,文件接收模块通过REST接口形式接收文件。REST用来规范应用如何在HTTP层与API提供方进行数据交互;REST描述了HTTP层里客户端和服务器端的数据交互规则;客户端通过向服务器端发送HTTP请求,接收服务器的响应,完成一次HTTP交互,这个交互过程中,REST架构约定两个重要方面就是HTTP请求所采用的方法,以及请求的链接。
[0036]在一些实施例中,参照图1所示,文件格式自适应模块对于Microsoft Office Word格式文件,采用ApachePOI读取文件中内容,通过使用端对端神经网络模型对文件中内容进行提取,其中,ApachePOI是一个解析Microsoft Documents的Java程序库。提取不动产单元、证书序号内容,再按照电子证明模板重新组织内容,以生成新的电子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文件格式自适应的不动产电子证照管理系统,其特征在于,包括:文件接收模块,所述文件接收模块用于接收文件;文件格式自适应模块,所述文件接收模块将接收到的文件传递给所述文件格式自适应模块,所述文件格式自适应模块生成新的电子证照文件;签章模块,所述文件格式自适应模块将生成的新的电子证照文件传递给所述签章模块,所述签章模块用于生成对应的电子签章文件;存储模块,所述存储模块用于接收签章模块的电子证照文件和电子签章文件,并存储相关信息。2.根据权利要求1所述的一种基于文件格式自适应的不动产电子证照管理系统,其特征在于,所述文件接收模块通过REST接口形式接收文件。3.根据权利要求1所述的一种基于文件格式自适应的不动产电子证照管理系统,其特征在于,所述文件格式自适应模块对于Microsoft Office Word格式文件,采用ApachePOI读取文件中内容,通过使用端对端神经网络模型对文件中内容进行提取,其中,ApachePOI是一个解析Microsoft Documents的Java程序库。4.根据权利要求1所述的一种基于文件格式自适应的不动产电子证照管理系统,其特征在于,所述文件格式自适应模块对于PDF格式文件,采用itextpdf方法读取文件中内容,通过使用端对端神经网络模型对文件中内容进行提取,其中,itextpdf是一个解析PDF文件的Java程序库。5.根据权利要求3或4所述的一种基于文件格式自适应的不动产电子证照管理系统,其特征在于,所述端对端神经网络模型利用ResNet+FPN作为骨干网络进行文字检测,利用检测网络和ROIAlign算法的结果进行attention+encoder

decoder的文字识别,将文本位置信息、视觉信息、语义信息进行融合,并...

【专利技术属性】
技术研发人员:王兆亮徐恒曹佳吴春争
申请(专利权)人:苏州工业园区测绘地理信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1