业务建模方法及可读存储介质技术

技术编号:38829234 阅读:17 留言:0更新日期:2023-09-15 20:08
本发明专利技术提供了一种业务建模方法及可读存储介质。所述业务建模方法包括:基于元数据的实体和属性计算关联矩阵并进行非排他性分区聚类;基于所述分区聚类结果,构建业务模型。如此配置,一方面,通过算法自动化地构建业务模型,减少了通过人工构建的时间成本和人力成本,避免了因构建者自身的缺陷导致的数据模型与实际业务场景不匹配的问题;另一方面,能够与业务的开展过程同步进行,当业务发生变化时,通过输入数据的变化能够自适应地改变业务模型,避免了因时间跨度长导致的数据模型与实际业务场景不匹配的问题;也为业务模型的关联性等拓展功能提供了前提条件。性等拓展功能提供了前提条件。性等拓展功能提供了前提条件。

【技术实现步骤摘要】
业务建模方法及可读存储介质


[0001]本专利技术涉及大数据处理
,特别涉及一种业务建模方法及可读存储介质。

技术介绍

[0002]现有的数据建模方法可以根据数据类型、模型类型、实现方式等多个维度分类,基本上可以覆盖任何数据建模场景。然而,从实际应用情况来看,现有的数据建模方法存在着一些缺陷,这些缺陷往往会导致数据建模的结果与实际业务场景不匹配。
[0003]首先,现有的数据建模方法过于专注于技术而忽视了业务。在许多数据建模实践中,数据模型往往是由技术人员设计和维护的,而这些技术人员往往只关心技术的实现和性能优化,而忽视了业务场景的需求。因此,这些数据模型往往局限于技术细节和性能考虑,忽略了业务场景的复杂性和变化。这样会导致数据模型与实际业务场景不匹配,从而影响业务效率和数据质量。
[0004]其次,现有的数据建模方法在长期业务变化中显得过于脆弱。在实际业务场景中,业务需求随着市场变化和技术发展的不断变化而发生改变,但现有的数据建模方法在长期变化中显得过于脆弱。一旦数据模型与业务场景脱节,就需要花费大量的时间和精力来重新设计和实现数据模型。这不仅浪费时间和资源,也会影响业务创新和业务竞争力。
[0005]此外,现有的数据建模方法往往难以建立有效的数据资产管理和应用。随着数据量的不断增长和数据应用场景的不断扩展,管理数据资产和应用变得越来越复杂。然而,现有的数据建模方法往往无法建立有效的数据资产管理和应用,数据模型难以与现有业务系统和数据交换进行无缝衔接,从而阻碍了数据资产的有效管理和应用,造成了资源浪费。
[0006]综上所述,现有的数据建模方法存在着一些局限性和缺陷,这些缺陷通常会导致数据模型与实际业务场景不匹配。为了解决这些问题,我们需要重新思考数据建模方法的目标和方法,更加注重业务场景和数据资产管理和应用,以实现更好的数据建模结果和业务价值。

技术实现思路

[0007]本专利技术的目的在于提供一种业务建模方法及可读存储介质,以解决现有技术中存在的数据模型与实际业务场景不匹配的问题。
[0008]为了解决上述技术问题,本专利技术提供了一种业务建模方法,包括:获取元数据,确认所述元数据的实体和属性;其中,所述元数据来源于不同的数据接口和不同的软硬件设备。对于每一个所述属性,计算各所述实体之间的关联矩阵。基于所述关联矩阵进行所述属性的非排他性分区聚类。基于所述分区聚类结果,构建业务模型。以及,输出所述业务模型。
[0009]可选的,在计算所述关联矩阵之前,对获取得到的所述元数据进行数据清洗。
[0010]可选的,基于指标因数计算所述关联矩阵。所述指标因数包括如下指标中的至少一者:所述实体的功能的相似性、所述属性的含义的相似性、所述属性是否为主键或唯一键、所述属性之间是否存在外键关系、所述属性的数据类型的相似性、所述实体的数据存
量、所述实体的数据增量、具有有效数据的所述属性的数据量、不同的所述实体的相同所述属性间的关联的数据量和不同的所述属性的数据之间的相似度。
[0011]可选的,至少基于所述实体的所述指标因数、所述实体的权重和修正参数计算所述关联矩阵。
[0012]可选的,所述关联矩阵按照如下公式计算:
[0013][0014]其中,Cm
i,j
表示第m个所述关联矩阵中第i行第j列的关联系数,Cm
i,j
同时也表示第m个所述属性在第i个所述实体和第j个所述实体中的关联度,θ表示修正系数,b表示偏移量,p表示所述指标因数的总数,f(k)表示第k个所述指标因数的自定义调整函数,X
i,k
表示第m个所述属性关于第i个所述实体的第k个所述指标因数,Y
i,k
表示第m个所述属性关于第j个所述实体的第k个所述指标因数,α
i
表示第i个所述实体的权重,β
j
表示第j个所述实体的权重,γ
i,j
表示第i个所述实体和第j个所述实体之间的差异系数;θ、b、f(k)和γ
i,j
统称为所述修正参数。
[0015]可选的,所述基于所述关联矩阵进行所述属性的非排他性分区聚类的步骤包括:
[0016]以所述属性为个体,对该所述属性在所述关联度矩阵中的所有关联度数据进行归一化处理,进行高斯参数拟合,形成以来源实体、目标实体、关联度为核心的高斯分布数据点。
[0017]获取簇的数量参数或者按照预设逻辑设定所述簇的数量,随机初始化每个簇的高斯分布参数,所述高斯分布参数包括均值和方差。
[0018]给定每个所述簇的高斯分布,计算每个所述数据点属于每个所述簇的概率。
[0019]以及,若符合结束条件,则完成非排他性分区聚类,若不符合所述结束条件,改变每个所述簇的高斯分布参数并重新计算每个所述数据点属于每个所述簇的概率。
[0020]可选的,所述结束条件包括以下条件中的一者或者多者:所述数据点概率的大小符合预设条件;两次相邻的计算中所述数据点概率的差值小于预设差值;重新计算的次数超过预设次数;以及,接收到外部输入的结束指令。
[0021]可选的,所述基于所述分区聚类结果,构建业务模型的步骤包括:每个所述簇构建为一个业务对象;每个所述簇中的所述数据点所对应的所述属性均被配置为对应的所述业务对象的业务属性;以及,基于所述属性的特征设置所述业务属性的特征。
[0022]可选的,所述基于所述分区聚类结果,构建业务模型的步骤还包括:若不同的所述业务对象包含有相同的所述业务属性,建立所述业务对象的相同的所述业务属性间的外键关联。
[0023]为了解决上述技术问题,本专利技术还提供了一种可读存储介质,所述可读存储介质上存储有程序,所述程序运行时,执行上述的业务建模方法。
[0024]与现有技术相比,本专利技术提供的一种业务建模方法及可读存储介质中,所述业务建模方法包括:获取元数据,确认所述元数据的实体和属性;其中,所述元数据来源于不同的数据接口和不同的软硬件设备。对于每一个所述属性,计算各所述实体之间的关联矩阵。基于所述关联矩阵进行所述属性的非排他性分区聚类。基于所述分区聚类结果,构建业务模型。以及,输出所述业务模型。如此配置,一方面,通过算法自动化地构建业务模型,减少
了通过人工构建的时间成本和人力成本,避免了因构建者自身的缺陷导致的数据模型与实际业务场景不匹配的问题;另一方面,能够与业务的开展过程同步进行,当业务发生变化时,通过输入数据的变化能够自适应地改变业务模型,避免了因时间跨度长导致的数据模型与实际业务场景不匹配的问题;也为业务模型的关联性等拓展功能提供了前提条件。本专利技术解决了现有技术中存在的因特定的缺陷导致的数据模型与实际业务场景不匹配的问题。
附图说明
[0025]本领域的普通技术人员将会理解,提供的附图用于更好地理解本专利技术,而不对本专利技术的范围构成任何限定。其中:
[0026]图1是本专利技术一实施例的业务建模方法的流程示意图;
[0027]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种业务建模方法,其特征在于,包括:获取元数据,确认所述元数据的实体和属性;其中,所述元数据来源于不同的数据接口和不同的软硬件设备;对于每一个所述属性,计算各所述实体之间的关联矩阵;基于所述关联矩阵进行所述属性的非排他性分区聚类;基于所述分区聚类结果,构建业务模型;以及,输出所述业务模型。2.根据权利要求1所述的业务建模方法,其特征在于,在计算所述关联矩阵之前,对获取得到的所述元数据进行数据清洗。3.根据权利要求1所述的业务建模方法,其特征在于,基于指标因数计算所述关联矩阵,所述指标因数包括如下指标中的至少一者:所述实体的功能的相似性、所述属性的含义的相似性、所述属性是否为主键或唯一键、所述属性之间是否存在外键关系、所述属性的数据类型的相似性、所述实体的数据存量、所述实体的数据增量、具有有效数据的所述属性的数据量、不同的所述实体的相同所述属性间的关联的数据量和不同的所述属性的数据之间的相似度。4.根据权利要求3所述的业务建模方法,其特征在于,至少基于所述实体的所述指标因数、所述实体的权重和修正参数计算所述关联矩阵。5.根据权利要求4所述的业务建模方法,其特征在于,所述关联矩阵按照如下公式计算:其中,Cm
i,j
表示第m个所述关联矩阵中第i行第j列的关联系数,Cm
i,j
同时也表示第m个所述属性在第i个所述实体和第j个所述实体中的关联度,θ表示修正系数,b表示偏移量,p表示所述指标因数的总数,f(k)表示第k个所述指标因数的自定义调整函数,X
i,k
表示第m个所述属性关于第i个所述实体的第k个所述指标因数,Y
i,k
表示第m个所述属性关于第j个所述实体的第k个所述指标因数,α
i
表示第i个所述实体的权重,β
j
表示第j个所述实...

【专利技术属性】
技术研发人员:吴文龙吴育锋周岳
申请(专利权)人:上海爱可生信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1