一种复杂装备全生命周期多源异构数据融合模式构建方法技术

技术编号:37230246 阅读:10 留言:0更新日期:2023-04-20 23:12
本发明专利技术涉及一种复杂装备全生命周期多源异构数据融合模式构建方法。该方法包括:建立复杂装备多源异构数据数据冗余属性的识别方法;建立基于产品族元结构树的可重用知识数据关联映射、设计结构树生成及的设计阶段数据关联映射、制造结构树生成及制造阶段数据关联映射、运维结构树生成及运维阶段数据关联映射算法;基于函数依赖和关系模型的外键约束,构建出整合多源异构数据的复杂装备全生命周期数据模式。本发明专利技术通过建立复杂装备设计、制造、运维阶段数据关联映射及阶段间数据映射方法,解决了复杂装备设计、制造、运维阶段各业务系统独立应用造成的物理信息数据结构的差异性、特征的冗余性和数据间关联关系缺失造成的孤岛问题。问题。问题。

【技术实现步骤摘要】
一种复杂装备全生命周期多源异构数据融合模式构建方法


[0001]本专利技术涉及一种物理信息数据融合模式构建方法,具体涉及一种复杂装备全生命周期多源异构数据融合模式构建方法。

技术介绍

[0002]复杂装备如高速列车、盾构机、核电装备等,其设计、制造和运维过程跨多个专业和企业,涉及众多的物理信息系统,由于每个物理信息系统面向的问题及提供商不同,造成复杂装备全生命周期数据的多源异构性,使得产品生命周期中不同学科、不同阶段的多维异构信息不能在系统层面上得到统一表达。当前学者研究重点大多集中在通用的多源异构数据转换和融合算法、多源多维异构多模态复杂数据分类与建模方法研究上,未见有针对复杂装备设计、制造和运维各阶段数据关联映射及阶段间数据关联映射方法及集成数据模式构建方法的研究。
[0003]复杂装备全生命周期数据的采集、关联映射和闭环反馈是构建设计优化迭代和数字孪生的基石,通过数据挖掘和智能计算能有效改进各阶段的参数,为产品不断优化迭代提供重要价值。然而当前各阶段积累的大量物理信息数据的多源异构性,使得数据缺乏完整性和一致性,在很大程度上影响了数据的可信度和可用性,使数据的价值难以得到有效体现。

技术实现思路

[0004]为了实现上述专利技术目的,本专利技术提供了以下技术方案:
[0005]一种复杂装备全生命周期多源异构数据融合模式构建方法,包括以下步骤:
[0006]步骤S1:多源异构数据冗余属性的识别与约简;
[0007]步骤S2:建立数据实体间关联映射模型;
[0008]步骤S3:产品族元结构树及知识类数据关联映射;
[0009]步骤S4:设计阶段数据关联映射;
[0010]步骤S5:制造阶段数据关联映射;
[0011]步骤S6:运维阶段数据关联映射;
[0012]步骤S7:多源异构数据转换融合入库方法;
[0013]其中,步骤S1包括步骤S11

步骤S12;
[0014]步骤S11:多源异构数据主属性标记;
[0015]对于同一数据对象X的两个数据源D
x1
和D
x2
,分别针对标称属性和数值属性提出不同的冗余属性识别和约简方法;首先,读取数据库字典获得各自的主属性PK(D
x1
)和PK(D
x2
),判断PK(D
x1
)和PK(D
x2
)是否为算法生成的全球唯一标识或自增类型,分为以下3种情况处理:
[0016](1)若两者中有一个是全球唯一标识或自增类型,则将该属性做删除标记,另一个属性标记为主属性;
[0017](2)若两者都是全球唯一标识或自增类型,提醒管理员从D
x1
和D
x2
剩余属性集中选择主属性,并对两个主属性做删除标记;
[0018](3)若两者都既不是全球唯一标识也不是自增类型,判断两者名称及数据类型是否相同,若相同则保留数据样本多的一个标记为主属性,若不同则提醒管理员从PK(D
x1
)和PK(D
x2
)中选择一个标记为主属性;
[0019]步骤S12:按照属性值范围将属性分为标称属性和数值属性,对属于同一数据类型的属性进行约简;步骤S12包括步骤S121

步骤S122;
[0020]步骤S121:标称属性约简;
[0021]属性A和属性B是来自不同系统D
x1
和D
x2
的两个属性,属性A有c个值,A(a1,a2,

,a
c
),属性B有r个值B(b1,b2,

,b
r
),则属性A和属性B是否描述同一特征做如公式(1)计算:
[0022][0023]其中:x2为卡方检测值,o
ij
为观测频度,e
ij
为期望频度,e
ij
的计算公式(2)如下:
[0024][0025]count(A=a
i
)表示取a
i
值的数据样本个数,count(B=b
j
)为取值为b
j
的样本个数,n为数据样本总数;对计算出的x2通过卡方表对比,如果相关,则比较属性A和B的数据类型定义长度,保留数据类型定义长度大的属性,另一个属性标记为冗余;
[0026]步骤S122:数值属性约简;
[0027]属性A和属性B是来自不同系统两个属性,通过计算协方差来衡量属性A和B的相关度如公式(3)所示:
[0028][0029]式中,a
i
∈{a1,a2,

,a
n
)为属性A的n个样本的值,b
i
∈{b1,b2,

,b
n
)为属性B的n个样本的值,和分别为属性A和B的均值,n为样本数;
[0030]由协方差进一步计算属性A和B的相关系数如公式(4):
[0031][0032]式中:σ
A
和σ
B
分别代表属性A和B对应数据的标准差;
[0033]计算结果r
A,B
与设定的阈值比对,若超过阈值,则:
[0034]比较属性A和B的数据类型定义长度,保留数据类型定义长度大的属性,另一个属性标记为冗余;
[0035]其中,步骤S2:建立数据实体间关联映射模型;
[0036]设D
x
和D
y
代表两类不同对象的数据实体,采用关系数据模型建立这两类数据实体之间的参照完整性关联映射如式(5)所示:
[0037][0038]式中:f(D
x
,D
y
)表示D
x
和D
y
间的关联映射函数,D
x
×
D
y
表示D
x
和D
y
两个数据集做笛卡尔积运算,表示在D
x
数据模式的A属性和D
y
数据模式的A

属性值相等下的条件
选择运算,在上述映射关系中,D
x
称为参照数据关系实体,D
x
.A为D
x
的参照属性,D
y
称为被参照关系实体,D
y
.A

为D
y
的主属性集;
[0039]其中,步骤S7包括步骤S71

步骤S74;
[0040]步骤S71:对数据对象X,业务系统J的数据模式为为由n个属性构成的数据模式其对应的全生命周期数据仓库模式S
x
(A
x1
,A
x2
,

A
x本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复杂装备全生命周期多源异构数据融合模式构建方法,其特征在于:包括以下步骤:步骤S1:多源异构数据冗余属性的识别与约简;步骤S2:建立数据实体间关联映射模型;步骤S3:产品族元结构树及知识类数据关联映射;步骤S4:设计阶段数据关联映射;步骤S5:制造阶段数据关联映射;步骤S6:运维阶段数据关联映射;步骤S7:多源异构数据转换融合入库方法;其中,步骤S1包括步骤S11

步骤S12;步骤S11:多源异构数据主属性标记;对于同一数据对象X的两个数据源D
x1
和D
x2
,分别针对标称属性和数值属性提出不同的冗余属性识别和约简方法;首先,读取数据库字典获得各自的主属性PK(D
x1
)和PK(D
x2
),判断PK(D
x1
)和PK(D
x2
)是否为算法生成的全球唯一标识或自增类型,分为以下3种情况处理:(1)若两者中有一个是全球唯一标识或自增类型,则将该属性做删除标记,另一个属性标记为主属性;(2)若两者都是全球唯一标识或自增类型,提醒管理员从D
x1
和D
x2
剩余属性集中选择主属性,并对两个主属性做删除标记;(3)若两者都既不是全球唯一标识也不是自增类型,判断两者名称及数据类型是否相同,若相同则保留数据样本多的一个标记为主属性,若不同则提醒管理员从PK(D
x1
)和PK(D
x2
)中选择一个标记为主属性;步骤S12:按照属性值范围将属性分为标称属性和数值属性,对属于同一数据类型的属性进行约简;步骤S12包括步骤S121

步骤S122;步骤S121:标称属性约简;属性A和属性B是来自不同系统D
x1
和D
x2
的两个属性,属性A有c个值,A(a1,a2,

,a
c
),属性B有r个值B(b1,b2,

,b
r
),则属性A和属性B是否描述同一特征做如公式(1)计算:其中:x2为卡方检测值,o
ij
为观测频度,e
ij
为期望频度,e
ij
的计算公式(2)如下:count(A=a
i
)表示取a
i
值的数据样本个数,count(B=b
j
)为取值为b
j
的样本个数,n为数据样本总数;对计算出的x2通过卡方表对比,如果相关,则比较属性A和B的数据类型定义长度,保留数据类型定义长度大的属性,另一个属性标记为冗余;步骤S122:数值属性约简;属性A和属性B是来自不同系统两个属性,通过计算协方差来衡量属性A和B的相关度如公式(3)所示:
式中,a
i
∈{a1,a2,

,a
n
)为属性A的n个样本的值,b
i
∈{b1,b2,

,b
n
)为属性B的n个样本的值,和分别为属性A和B的均值,n为样本数;由协方差进一步计算属性A和B的相关系数如公式(4):式中:σ
A
和σ
B
分别代表属性A和B对应数据的标准差;计算结果r
A,B
与设定的阈值比对,若超过阈值,则:比较属性A和B的数据类型定义长度,保留数据类型定义长度大的属性,另一个属性标记为冗余;其中,步骤S2:建立数据实体间关联映射模型;设D
x
和D
y
代表两类不同对象的数据实体,采用关系数据模型建立这两类数据实体之间的参照完整性关联映射如式(5)所示:式中:f(D
x
,D
y
)表示D
x
和D
y
间的关联映射函数,D
x
×
D
y
表示D
x
和D
y
两个数据集做笛卡尔积运算,表示在D
x
数据模式的A属性和D
y
数据模式的A

属性值相等下的条件选择运算,在上述映射关系中,D
x
称...

【专利技术属性】
技术研发人员:王淑营崔高舜丁国富张海柱郑庆
申请(专利权)人:西南交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1