自助政务数据存储系统及自助政务终端技术方案

技术编号:34896457 阅读:18 留言:0更新日期:2022-09-10 13:56
本发明专利技术提供了一种自助政务数据存储系统及自助政务终端,其中所述系统包括,扫描装置,用于获取文件图像;比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;基于比较的结果,将扫描后的文件按照文件的基本内容进行分类,并按照分类的结果进行对应的存储,分类后并提取文件内容的主要关键词,基于关键词来建立索引,便于通过索引进行查询。引进行查询。引进行查询。

【技术实现步骤摘要】
自助政务数据存储系统及自助政务终端


[0001]本专利技术涉及数据存储
,特别是涉及一种自助政务数据存储系统及自助政务终端。

技术介绍

[0002]现有的自助终端在进行文件存储时,一般都是利用政务管理系统来进行文件的存储,即在自助政务终端安装政务管理软件,根据自助业务的产生来记录相关的文件信息,木点使用的大多数的政务管理软件关于存储的技术中,基本上采用的是“非结构化”数据,这些数据不能进行分类存储和检索,需要政务人员定时的将内部的文件拷贝出来后进行一一整理,造成工作量巨大,且在整理后进行分类过程中容易造成分类错误。

技术实现思路

[0003]有鉴于此,本专利技术的主要目的在于提供一种自助政务数据存储系统及自助政务终端。
[0004]本专利技术采用的技术方案如下:
[0005]自助政务数据存储系统,包括:
[0006]扫描装置,用于获取文件图像;
[0007]比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;
[0008]若不同,在处理模块中建立一空白模板;
[0009]导入单元,用于将所述文件图像导入至所述空白模板上;
[0010]在所述处理模块中设置多个浮动窗口,将多个浮动窗口经导入单元导入到空白模板上;
[0011]调整单元,用于通过调整所述浮动窗口的大小来框取文件图像上的基础内容;
[0012]标准图像生成单元,用于在调整单元调整完毕后基于每一浮动窗口的大小和每一浮动窗口在空白模板上的位置建立格式参数;抽取文件图像后将所有浮动窗口对应的设置在空白模板上以建立标准图像;基于格式参数建立基础格式,并将基础格式存储在基础库中,将格式参数存储在参数库中;
[0013]识别模块,用于接收所述文件图像,并通过加载模块基于基础格式从参数库中加载基础格式对应设置的格式参数至识别模块,识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息;
[0014]人工智能系统,用于将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码;还用于基于对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系;
[0015]分类模块,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存
储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;
[0016]索引建立单元,用于依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录。
[0017]优选的,所述浮动窗口具有调整阈值,在设定的调整阈值内浮动窗口至少按照一个单位量进行拉伸或者收缩来框取文件图像上的基础内容;
[0018]在框取时,通过扫描模板扫描文件图像中的基础内容,以获取文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种,基于获取的文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种来设定浮动窗口的数量,并使得每一浮动窗口分别能够框取表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像以及公式,其中,每一浮动窗口用于表示文件图像中每一独立的子单元。
[0019]优选的,基于所述扫描模板逐一扫描过程中获取文件图像中的表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的任意一个来将浮动窗口进行导入。
[0020]优选的,所述识别模块具有:
[0021]接收部,用于接收所述文件图像;
[0022]配置单元,用于基于格式参数来配置识别框的运动轨迹,
[0023]识别框,用于基于所述运动轨迹来识别文件图像中每一子单元中数据信息,并基于所述运动轨迹将多个数据信息进行串接形成能够链接的多个片段的所述数据信息。
[0024]优选的,所述人工智能系统具有:
[0025]识别模型,该识别模型用于基于多个片段的所述数据信息进行迭代训练以进行内容识别、理解,基于内容识别、理解的结果形成分类码;
[0026]提取分析模型,该提取分析模型用于基于内容识别、理解提取多个关键词,设置每一关键词的权重,并基于关键词以及关键词的权重进行迭代训练以建立关键词之间的关联关系。
[0027]本专利技术还提供了一种自助政务终端,包含所述的自助政务数据存储系统。
[0028]本申请通过在自助政务终端上建立一套自动识别、分类系统,将扫描后的文件按照文件的基本内容进行分类,并按照分类的结果进行对应的存储,分类后并提取文件内容的主要关键词,基于关键词来建立索引,便于通过索引进行查询。
附图说明
[0029]以下附图仅对本专利技术作示意性的说明和解释,并不用于限定本专利技术的范围,其中:
[0030]图1为本专利技术的框架原理图;
[0031]图2为本专利技术中人工智能系统的原理图;
[0032]图3为本专利技术中实施例的系统原理图。
具体实施方式
[0033]为了使本专利技术的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通
过具体实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术。
[0034]参照图1,自助政务数据存储系统,包括:
[0035]扫描装置,用于获取文件图像;
[0036]比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;
[0037]若不同,在处理模块中建立一空白模板;
[0038]导入单元,用于将所述文件图像导入至所述空白模板上;
[0039]在所述处理模块中设置多个浮动窗口,将多个浮动窗口经导入单元导入到空白模板上;
[0040]调整单元,用于通过调整所述浮动窗口的大小来框取文件图像上的基础内容;
[0041]标准图像生成单元,用于在调整单元调整完毕后基于每一浮动窗口的大小和每一浮动窗口在空白模板上的位置建立格式参数;抽取文件图像后将所有浮动窗口对应的设置在空白模板上以建立标准图像;基于格式参数建立基础格式,并将基础格式存储在基础库中,将格式参数存储在参数库中;
[0042]识别模块,用于接收所述文件图像,并通过加载模块基于基础格式从参数库中加载基础格式对应设置的格式参数至识别模块,识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息;
[0043]人工智能系统,用于将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码;还用于基于对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.自助政务数据存储系统,其特征在于,包括:扫描装置,用于获取文件图像;比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;若不同,在处理模块中建立一空白模板;导入单元,用于将所述文件图像导入至所述空白模板上;在所述处理模块中设置多个浮动窗口,将多个浮动窗口经导入单元导入到空白模板上;调整单元,用于通过调整所述浮动窗口的大小来框取文件图像上的基础内容;标准图像生成单元,用于在调整单元调整完毕后基于每一浮动窗口的大小和每一浮动窗口在空白模板上的位置建立格式参数;抽取文件图像后将所有浮动窗口对应的设置在空白模板上以建立标准图像;基于格式参数建立基础格式,并将基础格式存储在基础库中,将格式参数存储在参数库中;识别模块,用于接收所述文件图像,并通过加载模块基于基础格式从参数库中加载基础格式对应设置的格式参数至识别模块,识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息;人工智能系统,用于将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码;还用于基于对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系;分类模块,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;索引建立单元,用于依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录。2.根据权利要求1所述的自助政务数据存储系统,其特征在于,所述浮动窗口具有调整阈值,...

【专利技术属性】
技术研发人员:朱劲松刘植
申请(专利权)人:湖北金赋智信科技发展有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1