【技术实现步骤摘要】
脚本数据提取方法、装置、计算机设备和存储介质
本申请涉及电力电网
,特别是涉及一种脚本数据提取方法、装置、计算机设备和存储介质。
技术介绍
随着信息化技术的发展,电子化的业务流、资金流和信息流已逐渐成为数据审计工作的主流,海量的数据审计需要借助信息化手段和大数据支持。其中,营销域审计模型涉及源表及模型成果输出数据集繁多,在相关表及数据集的匹配提取整合工作存在巨大的工作量挑战。电网行业的营销域涉及的脚本的数量过多,脚本间的关联关系也较为复杂,其中也包含多个伪表。目前,传统的营销域审计模型源表及结果整合的数据提取方式主要依托于系统原厂商提供和审计分析规则明确输出结果集的数据字典,通过人工设置过滤字段,提取目标的源表及结果表,然后查看具体的数据库实际数据进行复核,最终输出数据集并进行整合。上述数据提取方式,依靠人工进行数据提取,不仅耗费大量人力和时间,若遇到缺表或者表名称写错的情况,会导致数据提取结果出现纰漏,严重影响数据质量,由此可见,传统的审计模型源表及结果整合的提取方式存在数据提取效率过低的问题。 >专利技术内本文档来自技高网...
【技术保护点】
1.一种脚本数据提取方法,其特征在于,所述方法包括:/n获取脚本数据;/n提取所述脚本数据对应的正则表达式规则逻辑;/n基于所述正则表达式规则逻辑,生成正则表达式、并根据所述正则表达式提取所述脚本数据的底层数据和输出结果字段;/n根据预设文件名匹配模型,将提取出的底层数据和输出结果字段输出至所述预设文件名匹配模型对应的数据集合。/n
【技术特征摘要】
1.一种脚本数据提取方法,其特征在于,所述方法包括:
获取脚本数据;
提取所述脚本数据对应的正则表达式规则逻辑;
基于所述正则表达式规则逻辑,生成正则表达式、并根据所述正则表达式提取所述脚本数据的底层数据和输出结果字段;
根据预设文件名匹配模型,将提取出的底层数据和输出结果字段输出至所述预设文件名匹配模型对应的数据集合。
2.根据权利要求1所述的方法,其特征在于,基于所述正则表达式规则逻辑,生成正则表达式、并根据所述正则表达式提取所述脚本数据的底层数据包括:
导出当前数据库中数据表的表名称和所述表名称对应的注释数据,所述注释数据包括所述表名称对应的预设格式的表名称;
读取表名称和所述表名称对应的注释数据,存入至对应的变量数据;
基于所述正则表达式规则逻辑,生成第一正则表达式;
根据所述第一正则表达式,从所述脚本数据中匹配出所述底层数据表、并将所述底层数据表添加至预设数据结构;
遍历所述预设数据结构,根据所述变量数据提取出所述底层数据表的预设格式的表名称。
3.根据权利要求2所述的方法,其特征在于,所述遍历所述预设数据结构,根据所述变量数据提取出所述底层数据表的预设格式的表名称之后,还包括:
拼接所述底层数据表的表名称以及所述底层数据表的预设格式的表名称,得到结果字段。
4.根据权利要求1所述的方法,其特征在于,基于所述正则表达式规则逻辑,生成正则表达式、并根据所述正则表达式提取所述输出结果字段包括:
基于所述正则表达式规则逻辑,生成第二正则表达式;
基于所述第二正则采用贪婪匹配模式算法...
【专利技术属性】
技术研发人员:唐毓广,唐文彬,蓝文涛,周钰书,秦铖,赵永国,刘森,黎晚晴,郭洁,
申请(专利权)人:广西电网有限责任公司,南方电网数字电网研究院有限公司,
类型:发明
国别省市:广西;45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。