基于国产CPU和OS的电子文档检索及权限控制系统及方法技术方案

技术编号:33347785 阅读:19 留言:0更新日期:2022-05-08 09:46
本发明专利技术公开一种基于国产CPU和OS的电子文档检索及权限控制系统及方法,涉及大数据技术领域,其实现包括:读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源;对提取的文字信息进行清洗、筛选,形成索引目录库,同时接收用户输入的搜索关键词,以匹配索引目录库中的索引目录,进而返回索引地址、唯一标识和衍生信息;基于登录用户的角色赋予操作权限和数据权限,从而控制复制、下载、打印功能,控制用户有权查看的数据范围;根据返回的索引地址精确匹配到文档所在的位置信息,返回文档目录列表。本发明专利技术可以实现所查找文档的快速定位,同时,基于权限管理的控制,划定数据的展示范围,确保数据的安全性。安全性。安全性。

【技术实现步骤摘要】
基于国产CPU和OS的电子文档检索及权限控制系统及方法


[0001]本专利技术涉及大数据
,具体的说是一种基于国产CPU和OS的电子文档检索及权限控制系统及方法。

技术介绍

[0002]面对目前严峻的国际信息安全态势,我国正逐步加强信息安全防护的建设,信息安全正在逐步成为国家的重要安全战略。随着我国科研技术水平的提高和大量科研力量的投入,硬件水平持续发展,出现了龙芯、飞腾、鲲鹏等一批完全具有自主知识产权的国产芯片,与之配套的软件产品,例如国产操作系统中标麒麟、统信UOS,国产数据库神通、金仓、达梦,国产中间件东方通、金蝶,国产办公软件中标Office、金山WPS、福昕版式阅读器、数科版式阅读器等应运而生,丰富完善国产软件生态系统。
[0003]在此大背景下,基于国产环境下的电子公文系统已在政府等部门率先使用,电子公文系统中会生产大量的电子公文文档,涉及wps、et、ofd等各种格式的文档,由此造成用户在海量的数据中根据内容查找需要的文档时极为的费时、费力。同时,考虑到系统的数据安全性问题,部分电子公文文档只能在一定范围内公开或者涉密等级较高,需要保证既能快速准确的查找到需要的数据,又要兼顾数据的安全性问题。

技术实现思路

[0004]本专利技术针对目前技术发展的需求和不足之处,提供一种基于国产CPU和OS的电子文档检索及权限控制系统及方法。
[0005]首先,本专利技术提供一种基于国产CPU和OS的电子文档检索及权限控制系统,解决上述技术问题采用的技术方案如下:
[0006]一种基于国产CPU和OS的电子文档检索及权限控制系统,其结构包括:
[0007]文字提取模块,用于读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源;
[0008]搜索引擎模块,用于对文字提取模块提取的文字信息进行清洗、筛选,形成索引目录库,还用于接收用户输入的搜索关键词,以匹配索引目录库中的索引目录,进而返回索引地址、唯一标识和衍生信息;
[0009]权限管理模块,用于基于登录用户的角色赋予操作权限和数据权限,从而控制复制、下载、打印功能,控制用户有权查看的数据范围;
[0010]数据展示模块,用于根据搜索引擎模块返回的索引地址精确匹配到文档所在的位置信息,进而返回电子公文文档目录列表。
[0011]可选的,所涉及文字提取模块具体包括:
[0012]文档接收单元,用于接收电子公文文档;
[0013]提取文字单元,用于提取所接收电子公文文档的唯一标识、衍生信息和包含的文字信息,所述衍生信息包含密级、起草人、起草部门、审批人;
[0014]保存文字单元,用于保存提取文字单元提取的唯一标识、衍生信息和文字信息。
[0015]进一步可选的,所涉及搜索引擎模块具体包括:
[0016]文档处理单元,用于接收文字提取模块提取的唯一标识和文字信息,并利用分词组件对文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系;
[0017]检索单元,用于接收用户输入的搜索关键词,并到索引目录库中进行关键词组的匹配,根据匹配结果得到电子公文文档的索引地址、唯一标识和衍生信息。
[0018]进一步可选的,所涉及权限管理模块具体包括:
[0019]用户管理单元,用于对用户组或单个用户进行管理;
[0020]角色管理单元,用于定义用户组或单个用户的角色,并基于定义的角色进行权限分配;
[0021]权限设置单元,用于设置用户组或单个用户所属不同角色时的操作权限和数据权限,所述操作权限进一步包括用户组或单个用户所属不同角色时的复制、下载、打印权限,所述数据权限进一步包括用户组或单个用户所属不同角色时有权查看电子公文文档的数据范围;
[0022]数据处理模块,用于接收搜索引擎模块返回的索引地址、唯一标识和衍生信息,并根据当前用户所属的角色进行权限验证,过滤掉权限范围外的数据,传送至数据展示模块。
[0023]进一步可选的,所涉及数据展示模块和所述搜索引擎模块通过UI页面与用户进行交互;
[0024]用户通过UI页面输入搜索关键词后,UI页面对数据展示模块接收的数据进行组装和展示,用户通过UI页面即可查看与输入信息相对应的电子公文文档目录列表。
[0025]其次,本专利技术提供一种基于国产CPU和OS的电子文档检索及权限控制方法,解决上述技术问题采用的技术方案如下:
[0026]一种基于国产CPU和OS的电子文档检索及权限控制方法,其实现内容包括:
[0027](一)准备阶段:
[0028]读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源,所述衍生信息包含密级、起草人、起草部门、审批人;
[0029]对提取的文字信息进行清洗、筛选,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系;
[0030]定义用户组或单个用户的角色,设置不同角色对电子公文文档的操作权限和数据权限;
[0031](二)查看阶段:
[0032]用户组或单个用户以不同的角色登录索引目录库,随后通过UI页面输入搜索关键词,UI页面基于该关键词匹配索引目录库中的索引目录,得到与输入信息相对应的电子公文文档目录列表,点击电子公文文档目录即可进行该文档中有权限内容的展示。
[0033]可选的,对提取的文字信息进行清洗、筛选,形成关键词组,具体流程包括:
[0034]利用分词组件对提取的文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组。
[0035]可选的,可以对用户组或单个用户定义多个不同的角色;
[0036]基于电子公文文档的衍生信息,设置不同角色对电子公文文档的操作权限和数据权限。
[0037]进一步可选的,通过设置角色对电子公文文档的操作权限,可以控制用户组或单个用户对电子公文文档的复制、下载、打印;
[0038]通过设置角色对电子公文文档的数据权限,可以控制用户组或单个用户有权查看电子公文文档的数据范围。
[0039]本专利技术的一种基于国产CPU和OS的电子文档检索及权限控制系统及方法,与现有技术相比具有的有益效果是:
[0040](1)本专利技术有利于用户从大量电子公文文档中,快速定位到所需文档的位置,显著降低用户的查找难度和节省查找的时间,同时权限管理控制的使用,划定了数据信息的展示范围,确保了数据的安全性,避免了敏感数据的泄露;
[0041](2)本专利技术既能有效的解决大量电本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,其结构包括:文字提取模块,用于读取电子公文文档,并提取文档的唯一标识、衍生信息和包含的文字信息,作为全文搜索的数据源;搜索引擎模块,用于对文字提取模块提取的文字信息进行清洗、筛选,形成索引目录库,还用于接收用户输入的搜索关键词,以匹配索引目录库中的索引目录,进而返回索引地址、唯一标识和衍生信息;权限管理模块,用于基于登录用户的角色赋予操作权限和数据权限,从而控制复制、下载、打印功能,控制用户有权查看的数据范围;数据展示模块,用于根据搜索引擎模块返回的索引地址精确匹配到文档所在的位置信息,进而返回电子公文文档目录列表。2.根据权利要求1所述的基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,所述文字提取模块具体包括:文档接收单元,用于接收电子公文文档;提取文字单元,用于提取所接收电子公文文档的唯一标识、衍生信息和包含的文字信息,所述衍生信息包含密级、起草人、起草部门、审批人;保存文字单元,用于保存提取文字单元提取的唯一标识、衍生信息和文字信息。3.根据权利要求2所述的基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,所述搜索引擎模块具体包括:文档处理单元,用于接收文字提取模块提取的唯一标识和文字信息,并利用分词组件对文字信息进行分词,将文字信息切分成一个个单独的单词,然后进行单词的清洗、筛选、去标点符号、去停用词,形成关键词组,将关键词组作为索引目录,存储到索引目录库,同时,将该关键词组所属电子公文文档的唯一标识和衍生信息存储到索引目录库,建立电子公文文档唯一标识和关键词组的映射关系;检索单元,用于接收用户输入的搜索关键词,并到索引目录库中进行关键词组的匹配,根据匹配结果得到电子公文文档的索引地址、唯一标识和衍生信息。4.根据权利要求3所述的基于国产CPU和OS的电子文档检索及权限控制系统,其特征在于,所述权限管理模块具体包括:用户管理单元,用于对用户组或单个用户进行管理;角色管理单元,用于定义用户组或单个用户的角色,并基于定义的角色进行权限分配;权限设置单元,用于设置用户组或单个用户所属不同角色时的操作权限和数据权限,所述操作权限进一步包括用户组或单个用户所属不同角色时的复制、下载、打印权限,所述数据权限进一步包括用户组或单个用户所属不同角色时有权查看电子公文文档的数据...

【专利技术属性】
技术研发人员:张佩佩牛毅恒
申请(专利权)人:浪潮软件集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1