【技术实现步骤摘要】
作业调度配置信息生成方法及其装置
[0001]本申请涉及计算机
,尤其涉及数据库技术、机器学习技术及自然语言处理技术等,特别的涉及一种作业调度配置信息生成方法、装置、电子设备及存储介质。
技术介绍
[0002]随着互联网及科技水平的发展,数据的重要性渐渐地被发掘。数据已经渗透到每个人的生活中。当前每个企业级项目几乎都有数据方面的加工、复制等的需求,各项目之间、本项目中都存在着数据的关联和依赖,下游的业务需要上游数据的支撑。当前系统之间的数据需求,都是业务人员沟通完成之后,再将具体的需求给数据人员讲解。中间因为信息的传递,可能会存在信息偏差,再加上数据在每个系统中存在不同的数据口径,加工逻辑也比较复杂,数据人员理解需求就需要花费比较大的时间,沟通成本比较大,从而导致项目开发效率变低。
技术实现思路
[0003]本申请提供一种作业调度配置信息生成方法、装置、电子设备及存储介质,以至少解决相关技术中数据需求理解花费时间长、沟通成本大而导致项目开发效率变低等的问题。本申请的技术方案如下:
[0004]根据本申请实施例的第一方面,提供一种作业调度配置信息生成方法,包括:
[0005]获取待处理的数据需求信息;
[0006]对所述数据需求信息进行梳理操作,以得到所述数据需求信息之中源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息;
[0007]根据所述源表与所述目标表各自的物理模型、以及所述源表与所述目标表间的数据映射信息,基于对应 ...
【技术保护点】
【技术特征摘要】
1.一种作业调度配置信息生成方法,其特征在于,包括:获取待处理的数据需求信息;对所述数据需求信息进行梳理操作,以得到所述数据需求信息之中源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息;根据所述源表与所述目标表各自的物理模型、以及所述源表与所述目标表间的数据映射信息,基于对应数据库的语句特性,生成目标SQL语句;其中,所述目标SQL语句用于将所述源表中的数据映射到所述目标表的对应字段;确定用于执行目标SQL语句的作业,并根据所述源表、所述目标表、所述源系统信息和所述目标表系统信息,确定与所述作业存在依赖关系的上下游作业;根据所述上下游作业、所述业务、以及作业依赖关系,生成作业调度配置信息。2.如权利要求1所述的方法,其特征在于,所述对所述数据需求信息进行梳理操作,以得到所述数据需求信息之中源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息,包括:结合文字库和机器学习模型对所述数据需求信息进行文字模糊匹配和自然语言处理,以得到所述数据需求信息之中源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息;其中,所述源表的物理模型包括源表和源表字段,所述目标表的物理模型包括目标表和目标表字段;所述数据映射信息包括服务方式、与所述服务方式对应的加工规则。3.如权利要求1所述的方法,其特征在于,所述根据所述源表与所述目标表各自的物理模型、以及所述源表与所述目标表间的数据映射信息,基于对应数据库的语句特性,生成目标SQL语句,包括:根据所述源表与所述目标表各自的物理模型、以及所述源表与所述目标表间的数据映射信息,确定所述源表中各字段映射到所述目标表中对应字段时所使用的服务方式和加工规则;将所述源表中字段通过对应的服务方式和加工规则,基于对应数据库的语句特性,拼接成SQL语句,并将拼接的SQL语句赋给所述目标表之中与所述源表中字段对应的字段,将所述目标表中所有字段的SQL语句进行拼接,以得到所述目标SQL语句。4.如权利要求1至3中任一项所述的方法,其特征在于,还包括:对所述目标SQL语句进行语法检验;确定所述目标SQL语句存在语法错误,获取所述目标SQL语句的语法调整信息;根据所述语法调整信息对所述目标SQL语句进行自动调整,或者,将所述语法调整信息提供给目标对象,并基于所述目标对象对所述调整信息的操作对所述目标SQL语句进行调整。5.如权利要求1所述的方法,其特征在于,所述根据所述上下游作业、所述业务、以及作业依赖关系,生成作业调度配置信息,包括:根据所述作业的执行频率、功能简称信息和时区信息生成所述目标表的作业流名称;根据所述目标表的名称和所述执行频率生成所述作业的作业名称;根据所述源表获取所述源表的作业流名称、条件名称、依赖的组件信息和前置依赖业务日期偏移规则;
将所述目标表的作业流名称、所述作业的作业名称、所述源表的作业流名称、所述条件名称、所述依赖的组件信息和所述前置依赖业务日期偏移规则,填进预设的作业调度配置模板中,以得到所述作业调度配置信息。6.如权利要求1所述的方法,其特征在于,在所述对所述数据需求信息进行梳理操作,以得到所述数据需求信息之中源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息之后,所述方法还包括:对所述源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息进行校验;确定校验结果,并根据所述校验结果生成对应的修改和/或优化建议信息;根据所述修改和/或优化建议信息,对所述源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息进行对应修改。7.如权利要求6所述的方法,其特征在于,所述对所述源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息进行校验,包括:判断所述源表与目标表各自的物理模型、所述源表与所述目标表间的数据映射信息、源系统信息和目标表系统信息是否为空;从所述目标表的物理模型中获取目标表字段,并判断所述目标表字段是否兼容源表字段加工的类型;判断所述源表字段和所述目标表字段是否存在;判断所述数据映射信息中服务方式是否符合规范,并判断所述数据映射信息中加工规则是否符合SQL语义规则。8.一种作业调度配置信息生成装置,其特征在于,包括:第一获取模块,...
【专利技术属性】
技术研发人员:黄二明,苏培煌,吴胜,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。