一种数据整合方法、装置、计算机设备、存储介质及产品制造方法及图纸

技术编号:39306698 阅读:9 留言:0更新日期:2023-11-12 15:54
本申请涉及大数据技术领域,尤其涉及金融科技领域或其他相关领域,本申请提供一种数据整合方法、装置、计算机设备、存储介质及产品,包括:获取业务对象;根据与业务对象对应的产品模板,对业务对象进行特征提取,得到业务特征;其中,产品模板中具有至少一个产品属性;产品属性是用于进行特征提取的元数据;根据至少一个业务特征创建特征聚合表;其中,特征聚合表包括至少一个业务特征;特征聚合表还包括产品编号和约束条件;对特征聚合表中的字段命名进行结构化处理,得到结构特征表。本申请无需根据属性参数中的取值逻辑从“竖表”中获取的方式得到属性参数,提高了数据提取效率,避免了数据提取操作易用性差的情况发生。了数据提取操作易用性差的情况发生。了数据提取操作易用性差的情况发生。

【技术实现步骤摘要】
一种数据整合方法、装置、计算机设备、存储介质及产品


[0001]本申请涉及大数据
,及涉及金融科技领域或其他相关领域,尤其涉及一种数据整合方法、装置、计算机设备、存储介质及产品。

技术介绍

[0002]业务产品是指能够提供给市场,被人们使用和消费,并能满足人们某种需求的任何东西,包括有形的物品、无形的服务、组织、观念或它们的组合。银行的业务产品多数无形的,分为负债业务产品、资产业务产品、中间业务产品三类,对产品的设计和管理大多由业务部门在产品管理系统维护。
[0003]然而,专利技术人发现,当前的业务产品的属性参数,通常是采用“竖表”进行存储,导致若需要获取业务产品的属性参数中的一个属性值,需要根据属性参数中的取值逻辑从“竖表”中获取,造成数据提取效率低下,易用性差的情况发生。

技术实现思路

[0004]本申请提供一种数据整合方法、装置、计算机设备、存储介质及产品,用以解决当前的业务产品的属性参数,在获取业务产品的属性参数中的一个属性值时,需要根据属性参数中的取值逻辑从“竖表”中获取,造成数据提取效率低下,易用性差的情况发生的问题。
[0005]第一方面,本申请提供一种数据整合方法,包括:
[0006]获取业务对象;其中,所述业务对象对应至少一个业务产品;所述至少一个业务产品对应同一使用场景;
[0007]根据与所述业务对象对应的产品模板,对所述业务对象进行特征提取,得到业务特征;其中,所述产品模板中具有至少一个产品属性;所述产品属性是用于进行特征提取的元数据;所述业务特征包括至少一个属性参数;所述属性参数用于描述所述业务对象;所述属性参数中具有至少一个用于描述属性参数的属性值;
[0008]根据至少一个业务特征创建特征聚合表;其中,所述特征聚合表包括至少一个所述业务特征;所述特征聚合表还包括产品编号和约束条件;所述产品编号是特征聚合表对应的业务对象的业务产品的唯一性标识;所述约束条件用于定义特征聚合表中属性参数的范围;
[0009]对特征聚合表中的字段命名进行结构化处理,得到结构特征表;其中,所述字段命名是属性参数的名称。
[0010]上述方案中,根据与所述业务对象对应的产品模板,对所述业务对象进行特征提取,得到业务特征,包括:
[0011]获取所述业务对象的属性参数名称;其中,所述属性参数名称是业务产品下的一个属性参数的名称;
[0012]根据所述属性参数名称和所述产品属性在产品基本信息表中进行特征提取得到基本字段值,以及根据属性参数名称和所述产品属性在产品条件信息表中进行特征提取得
到条件字段值;其中,所述产品基本信息表中记载有至少一个业务产品的基本属性的字段值;所述基本字段值用于描述属性参数名称对应属性参数的基本属性;所述产品条件信息表中记载有至少一个业务产品的条件信息的字段值;所述条件信息用于描述属性参数名称的取值的约束信息;所述条件字段值用于描述属性参数名称对应属性参数的条件信息;
[0013]将所述基本字段值和所述条件字段值录入所述产品模板中,得到所述属性参数名称的字段特征表;
[0014]对所述字段特征表中的条件值进行拆分得到至少一个取值条件,根据所述取值条件在复合条件构造信息表中进行特征提取,得到所述属性参数名称的至少一个属性值;其中,所述条件值是由至少一个取值条件的代码;所述取值条件用于约束属性参数名称的属性值的取值;所述复合条件构造信息中记载有至少一个业务产品的至少一个属性参数的参数值;所述参数值是用于描述一个业务产品下的至少一个属性参数的数据;所述属性值是复合条件构造信息表中用于描述属性参数名称对应属性参数的参数值;
[0015]汇总所述属性参数名称及所述属性参数名称的至少一个属性值得到属性参数,汇总至少一个所述属性参数,得到所述业务对象对应的业务特征。
[0016]上述方案中,所述约束条件包括:数据范围、统计口径和数据保留周期中的一个或几个;
[0017]其中,所述数据范围用于描述特征聚合表对应的业务产品涉及的业务范围;所述统计口径用于确定数据范围中符合预置的统计规则的业务产品,统计规则定义了纳入到数据范围的统计对象;所述数据保留周期用于定义特征聚合表中属性参数的保留时间。
[0018]上述方案中,对特征聚合表中的字段命名进行结构化处理,得到结构特征表,包括:
[0019]若确定第一字段命名对应的字段内容是由数据字典组成,则在所述第一字段命名的尾部插入第一字符;其中,所述第一字符用于表征所述第一字段命名的字段内容为数据字典;所述数据字典是用于访问数据库和应用程序元数据的目录;
[0020]若确定第二字段命名对应的字段内容包括是和非,则在所述第二字段命名的尾部插入第二字符;其中,所述第二字符用于表征所述第二字段命名的字段内容为是非判断。
[0021]上述方案中,对特征聚合表中的字段命名进行结构化处理,得到结构特征表之后,所述方法还包括:
[0022]将所述结构特征表录入预置的数据档案中,并在所述数据档案中插入档案属性信息;其中,所述档案属性信息用于描述所述数据档案中的结构特征表。
[0023]上述方案中,在所述数据档案中插入档案属性信息之后,所述方法还包括:
[0024]接收分析属性信息,根据所述分析属性信息获取结构特征表;其中,所述分析属性信息用于描述需要获取的结构特征表。
[0025]上述方案中,根据所述分析属性信息获取结构特征表,包括:
[0026]若确定所述分析属性信息为分析属性名称,则根据数据档案中的基本属性信息,获取与所述分析名称对应的结构特征表;其中,所述分析属性名称是属性参数名称;所述基本属性信息记载有结构特征表中的属性参数名称。
[0027]若确定所述分析属性信息为分析数值信息,则根据所述数据档案中的字段属性信息,获取与所述分析数值信息对应的结构特征表;其中,所述分析数值信息是属性参数中属
性值的数值信息;所述字段属性信息记载有结构特征表的中所有属性参数中属性值的数值信息。
[0028]若确定所述分析属性信息为分析对象名称,则根据所述数据档案中的管理属性信息,获取与所述分析对象名称对应的结构特征表;其中,所述分析对象名称是业务对象的名称和/或业务对象对应的产品;所述管理属性信息记载有结构特征表对应的业务对象的名称,以及业务对象的业务产品。
[0029]第二方面,本申请提供一种数据整合装置,包括:
[0030]数据输入模块,用于获取业务对象;其中,所述业务对象对应至少一个业务产品;所述至少一个业务产品对应同一使用场景;
[0031]特征提取模块,用于根据与所述业务对象对应的产品模板,对所述业务对象进行特征提取,得到业务特征;其中,所述产品模板中具有至少一个产品属性;所述产品属性是用于进行特征提取的元数据;所述业务特征包括至少一个属性参数;所述属性参数用于描述所述业务对象;所述属性参数中具有至少一个用于描述属性参数的属性值;
[0032]特征聚合模块本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据整合方法,其特征在于,包括:获取业务对象;其中,所述业务对象对应至少一个业务产品;所述至少一个业务产品对应同一使用场景;根据与所述业务对象对应的产品模板,对所述业务对象进行特征提取,得到业务特征;其中,所述产品模板中具有至少一个产品属性;所述产品属性是用于进行特征提取的元数据;所述业务特征包括至少一个属性参数;所述属性参数用于描述所述业务对象;所述属性参数中具有至少一个用于描述属性参数的属性值;根据至少一个业务特征创建特征聚合表;其中,所述特征聚合表包括至少一个所述业务特征;所述特征聚合表还包括产品编号和约束条件;所述产品编号是特征聚合表对应的业务对象的业务产品的唯一性标识;所述约束条件用于定义特征聚合表中属性参数的范围;对特征聚合表中的字段命名进行结构化处理,得到结构特征表;其中,所述字段命名是属性参数的名称。2.根据权利要求1所述的数据整合方法,其特征在于,根据与所述业务对象对应的产品模板,对所述业务对象进行特征提取,得到业务特征,包括:获取所述业务对象的属性参数名称;其中,所述属性参数名称是业务产品下的一个属性参数的名称;根据所述属性参数名称和所述产品属性在产品基本信息表中进行特征提取得到基本字段值,以及根据属性参数名称和所述产品属性在产品条件信息表中进行特征提取得到条件字段值;其中,所述产品基本信息表中记载有至少一个业务产品的基本属性的字段值;所述基本字段值用于描述属性参数名称对应属性参数的基本属性;所述产品条件信息表中记载有至少一个业务产品的条件信息的字段值;所述条件信息用于描述属性参数名称的取值的约束信息;所述条件字段值用于描述属性参数名称对应属性参数的条件信息;将所述基本字段值和所述条件字段值录入所述产品模板中,得到所述属性参数名称的字段特征表;对所述字段特征表中的条件值进行拆分得到至少一个取值条件,根据所述取值条件在复合条件构造信息表中进行特征提取,得到所述属性参数名称的至少一个属性值;其中,所述条件值是由至少一个取值条件的代码;所述取值条件用于约束属性参数名称的属性值的取值;所述复合条件构造信息中记载有至少一个业务产品的至少一个属性参数的参数值;所述参数值是用于描述一个业务产品下的至少一个属性参数的数据;所述属性值是复合条件构造信息表中用于描述属性参数名称对应属性参数的参数值;汇总所述属性参数名称及所述属性参数名称的至少一个属性值得到属性参数,汇总至少一个所述属性参数,得到所述业务对象对应的业务特征。3.根据权利要求1所述的数据整合方法,其特征在于,所述约束条件包括:数据范围、统计口径和数据保留周期中的一个或几个;其中,所述数据范围用于描述特征聚合表对应的业务产品涉及的业务范围;所述统计口径用于确定数据范围中符合预置的统计规则的业务产品,统计规则定义了纳入到数据范围的统计对象;所述数据保留周期用于定义特征聚合表中属性参数的保留时间。4.根据权利要求1所述的数据整合方法,其特征在于,对特征聚合表中的字段命名进行
结构化处理,得到结构特征表,包括:若确定第一字段命名对应的字段内容是由数据字典组成,则在所述第一字段命名的尾部插入第一字符;其中,所述第一字符用于表征所述第一字段命名的字段内容为数据字典;所述数据字典是用于访问数据库和应用程序元数据的目录;若...

【专利技术属性】
技术研发人员:廖勤吕彩艳胡涛
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1