报表文件安全规则建立方法、装置、设备及存储介质制造方法及图纸

技术编号:32462211 阅读:15 留言:0更新日期:2022-02-26 08:53
本发明专利技术涉及数据处理技术,揭露了一种报表文件安全规则建立方法,包括:提取报表文件的文本信息,得到报表信息文本;将报表信息文本执行分词操作,并利用分词结果构建语法树,得到第一报表信息词语集语法树;利用报表文件本体知识对报表信息词语集语法树进行分词结果预处理,并更新报表信息词语集语法树,得到第二报表信息词语集语法树;根据语法解析树规则,利用第二报表词语集语法树构建语法解析树;建立语法解析树各树节点的安全规则,构建安全规则结构树,完成报表文件安全规则的建立。本发明专利技术还提出一种报表文件安全规则建立装置、设备以及介质。本发明专利技术可以提高文件的安全性。性。性。

【技术实现步骤摘要】
报表文件安全规则建立方法、装置、设备及存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种报表文件安全规则建立方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]报表文件在各企业中占据着较大的价值比重,而用户的非时宜以及非正常地点的访问会导致报表文件的隐私数据泄露的风险,各企业会建立一个安全规则来保护报表文件的安全。
[0003]目前,安全规则的建立一般是在报表文件存放系统外构建一个安全密钥来阻止外部的访问,但这也阻碍了企业中相关人员在不知道安全密钥的情况下,想了解报表系统中非隐私报表文件的查看及参考,无法做到从报表文件本身属性构建安全规则。

技术实现思路

[0004]本专利技术提供一种报表文件安全规则建立方法、装置、设备及存储介质,其主要目的在于提高文件的安全性。
[0005]为实现上述目的,本专利技术提供的一种报表文件安全规则建立方法,包括:
[0006]从报表系统个获取报表文件,提取所述报表文件的文本信息,得到报表信息文本;
[0007]将所述报表信息文本执行分词操作,并利用分词结果构建语法树,得到第一报表信息词语集语法树;
[0008]对所述报表信息词语集语法树利用报表文件本体知识进行分词结果预处理,并更新所述报表信息词语集语法树,得到第二报表信息词语集语法树;
[0009]根据预构建的语法解析树规则,利用所述第二报表词语集语法树构建语法解析树;
[0010]建立所述语法解析树各树节点的安全规则,构建安全规则结构树。
[0011]可选地,所述利用报表文件本体知识调整所述第一报表信息词语集语法树,并更新调整后的所述第一报表信息词语集语法树,得到第二报表信息词语集语法树,包括:
[0012]遍历所述第一报表信息词语集语法树中各树节点,并将每一个树节点所对应的词语利用LTP分词工具进行词性标注,得到词性标注报表信息词语集语法树;
[0013]判断语法树中的树节点以及所述树节点相邻节点是否为名词词性;
[0014]若树节点与树节点相邻节点对应的词语皆为名词词性,则保持原有语法树节点不变;
[0015]若树节点与树节点相邻节点对应的词语不全为名词,则采用预构建的递归节点组合规则,对所述报表信息词语集语法树中该词语所对应的语法树节点与相邻节点进行组合,得到新的语法树节点;
[0016]汇总所有所述新的语法树节点以及不变的原有语法树节点得到所述第二报表词语集语法树。
[0017]可选地,所述将所述报表信息文本执行分词操作,并利用分词结果构建语法树,得到第一报表信息词语集语法树,包括:
[0018]利用LTP分词工具对所述报表信息文本执行分词操作,得到报表信息词语集;
[0019]提取所述报表信息文本的每个文本句子所对应的分词后的词语,并根据所述每个文本句子的句子结构构建语法树,得到所述第一报表信息词语集语法树。
[0020]可选地,所述建立所述语法解析树各树节点的安全规则,构建安全规则结构树,包括:
[0021]划分所述语法解析树各树节点的条件关系;
[0022]根据所述条件关系确定条件限定项以及比较条件限定项;
[0023]获取所述条件限定项以及比较条件限定项的属性;
[0024]利用所述属性制定所述语法解析树各树节点的安全规则。
[0025]可选地,所述获取报表文件,包括:
[0026]获取交易订单集;
[0027]识别所述交易订单集中的交易数据,并整合所述交易数据,得到交易数据集:
[0028]根据用户类别,将所述交易数据集组合成多张报表文件;
[0029]将多张所述报表文件上传至报表系统中,及从所述报表系统中获取报表文件。
[0030]可选地,所述提取所述报表文件的文本信息,得到报表信息文本,包括:
[0031]去除所述报表文件中的表格线;
[0032]利用OCR技术从去除表格线的报表文件中提取文字,并按照预定义的排字顺序将提取得到的所述文字复制于规定位置处,得到待整理文本;
[0033]对所述待整理文本中的文字执行文字标准化转化处理,并按照基于正则化规则的方式去除所述待整理文本中的特殊符号以及不规范文本,得到所述报表信息文本。
[0034]可选地,所述对所述待整理文本中的文字执行文字标准化转化处理,包括:
[0035]调整所述待整理文本中文字尺寸为同一大小,得到同尺寸标准化待整理文本。
[0036]为了解决上述问题,本专利技术还提供一种报表文件安全规则建立装置,所述装置包括:
[0037]语法树建立模块,用于获取报表文件,提取所述报表文件的文本信息,得到报表信息文本;将所述报表信息文本执行分词操作,并利用分词结果构建语法树,得到第一报表信息词语集语法树;利用报表文件本体知识调整所述第一报表信息词语集语法树,并更新调整后的所述第一报表信息词语集语法树,得到第二报表信息词语集语法树;
[0038]解析树建立模块,用于根据预构建的语法解析树规则,利用所述第二报表词语集语法树构建语法解析树;
[0039]安全规则建立模块,用于建立所述语法解析树各树节点的安全规则,构建安全规则结构树。
[0040]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0041]至少一个处理器;以及,
[0042]与所述至少一个处理器通信连接的存储器;其中,
[0043]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的报表文件安全
规则建立方法。
[0044]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的报表文件安全规则建立方法。
[0045]本专利技术实施例通过提取报表文件中的文本信息,并对所述文本信息执行分词操作;利用文本信息中的文本机子的句子结构及对应的分词词语构建词语集语法树,再利用报表文件的本体知识对所述词语集语法树进行更新,可以更好的完善解析词语集语法树,可提高词语集语法树中每个树节点词语的表达精准度;再根据预构建的语法解析树规则,对更新后的词语集语法树构建对应的语法解析树,并建立所述语法解析树各树节点的安全规则,构建安全规则结构树。进一步地,本专利技术构建的安全规则可以较完整的实现对报表文件的中隐私文件的安全防护,提高文件的安全性。
附图说明
[0046]图1为本专利技术一实施例提供的报表文件安全规则建立方法的流程示意图;
[0047]图2为本专利技术一实施例提供的报表文件安全规则建立装置的功能模块图;
[0048]图3为本专利技术一实施例提供的实现所述报表文件安全规则建立方法的电子设备的结构示意图。
[0049]本专利技术目的的实现、功能特点及优点将结合实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种报表文件安全规则建立方法,其特征在于,所述方法包括:获取报表文件,提取所述报表文件的文本信息,得到报表信息文本;将所述报表信息文本执行分词操作,并利用分词结果构建语法树,得到第一报表信息词语集语法树;利用报表文件本体知识调整所述第一报表信息词语集语法树,并更新调整后的所述第一报表信息词语集语法树,得到第二报表信息词语集语法树;根据预构建的语法解析树规则,利用所述第二报表词语集语法树构建语法解析树;建立所述语法解析树各树节点的安全规则,构建安全规则结构树。2.如权利要求1所述的报表文件安全规则建立方法,其特征在于,所述利用报表文件本体知识调整所述第一报表信息词语集语法树,并更新调整后的所述第一报表信息词语集语法树,得到第二报表信息词语集语法树,包括:遍历所述第一报表信息词语集语法树中各树节点,并将每一个树节点所对应的词语利用LTP分词工具进行词性标注,得到词性标注报表信息词语集语法树;判断语法树中的树节点以及所述树节点相邻节点是否为名词词性;若树节点与树节点相邻节点对应的词语皆为名词词性,则保持原有语法树节点不变;若树节点与树节点相邻节点对应的词语不全为名词,则采用预构建的递归节点组合规则,对所述报表信息词语集语法树中该词语所对应的语法树节点与相邻节点进行组合,得到新的语法树节点;汇总所有所述新的语法树节点以及不变的原有语法树节点得到所述第二报表词语集语法树。3.如权利要求1所述的报表文件安全规则建立方法,其特征在于,所述将所述报表信息文本执行分词操作,并利用分词结果构建语法树,得到第一报表信息词语集语法树,包括:利用LTP分词工具对所述报表信息文本执行分词操作,得到报表信息词语集;提取所述报表信息文本的每个文本句子所对应的分词后的词语,并根据所述每个文本句子的句子结构构建语法树,得到所述第一报表信息词语集语法树。4.如权利要求1所述的报表文件安全规则建立方法,其特征在于,所述建立所述语法解析树各树节点的安全规则,构建安全规则结构树,包括:划分所述语法解析树各树节点的条件关系;根据所述条件关系确定条件限定项以及比较条件限定项;获取所述条件限定项以及比较条件限定项的属性;利用所述属性制定所述语法解析树各树节点的安全规则。5.如权利要求...

【专利技术属性】
技术研发人员:熊志国李福宇熊一龙
申请(专利权)人:招商局金融科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1