关联异构系统同义数据的方法、装置、电子设备及介质制造方法及图纸

技术编号:19023459 阅读:21 留言:0更新日期:2018-09-26 19:04
本发明专利技术实施例提供了一种关联异构系统同义数据的方法、装置、电子设备及介质,其中方法包括:在第一异构系统中,判断是否有第一数据库表的第一位置,将第一位置所在的第一数据库的表项确定为第一目标属性项,确定第一目标属性项位置;在第二异构系统中,判断是否有第二数据库表的第二位置,将第二位置所在的第二数据库表的表项确定为第二目标属性项,确定第二目标属性项位置;将第一目标属性项位置与第二目标属性项位置建立关联;将第一目标属性项位置存储的属性内容,与第二目标属性项位置存储的属性内容,关联为第一异构系统与第二异构系统的同义数据。本发明专利技术实现了快速准确的识别并关联同义数据。

【技术实现步骤摘要】
关联异构系统同义数据的方法、装置、电子设备及介质
本专利技术涉及计算机信息处理
,特别是涉及一种关联异构系统同义数据的方法、装置、电子设备及介质。
技术介绍
完成相同或相近功能/业务的软件系统往往存在多种实现形式,这些软件系统形成同业系统。同业系统在完成上述相同或相近功能/业务时有三层含义:执行相同/相近的业务操作、遵循行业的有关业务标准(规范);具备相同或相似的业务操作界面来录入/产生业务数据;业务系统输入/输出的业务数据相同或高度相近。同业系统中存在结构不同或结构相近的多个独立系统,将这样的多个独立系统间互称为异构系统。多个异构系统中存在完全等价表达同一业务对象或其属性的数据,称这样的数据为异构系统的同义数据。从面向个人消费者的同业系统到面向企业的同业系统,这些同业系统中存在大量的异构系统对应的软件系统。其原因主要是同一细分领域存在多家互相竞争的企业,每个企业有自己独立的软件系统。例如我国为医院提供的医院信息化系统的厂商,据不完全统计就有130多家,其中全国性的大型厂商就有10多家,每个厂商都有为医院提供信息化管理的不同的软件系统。单一软件系统的市场占有率都不高,市场高度分散。出现这样的情况产生的结果从行业来看,不同厂商的软件系统,甚至同一厂商的多个软件系统的不同部署方式间,数据都无法打通和连接,数据形成了非常多的碎片,即“数据孤岛”。这为行业的融合发展、业务联动、大数据应用,以及监管都带来了很大的阻碍和困难。要解决这些问题,关键在于打通数据,连接“数据孤岛”上的数据,打通数据实现数据连接的关键又在于如何将不同异构系统中的同义数据进行识别和关联。现有技术中,有人工比对的方式将异构系统中的同义数据进行识别和关联。具体为,将同业系统的两个异构系统A、B的厂商提供的数据项说明文档,采用人工阅读理解的方式对说明文档中的数据项同义数据进行识别、比对和关联。另外,还有制定标准规范,统一转换的方式将异构系统中的同义数据进行识别和关联。该方法是由国家主管部门或行业组织,制定一个数据标准规范,将同业系统的两个异构系统A、B的全体厂商均按该标准进行数据格式转换,以规范的数据格式来交换。现有技术将异构系统的同义数据进行识别和关联的方法中,由于同业系统中的异构系统复杂且数据项非常多,所以使用人工比对的方式耗时耗力且容易出错,转换效率低。另外,使用统一转换的方式,如果一方的数据项定义发生了改变,不能及时通知对方,或者在多方异构系统两两异构系统中指定的转换标准不一致时,造成转换容易出错,转换效率低。综上所述,现有技术中将异构系统中的同义数据进行识别和关联的方法转换容易出错,且转换效率低,数据质量也难以保证。
技术实现思路
本专利技术实施例的目的在于提供一种关联异构系统同义数据的方法、装置、电子设备及介质,以实现快速、准确的识别并关联异构系统间的同义数据。具体技术方案如下:为达到上述专利技术目的,本专利技术实施例公开了一种关联异构系统同义数据的方法,包括:在第一异构系统的各数据库表中,判断是否有第一数据库表,该第一数据库表存在存储有预设样本集中每个数据对象的第一属性项的属性内容的第一位置,若存在该第一位置,将该第一位置所在的第一数据库的表项确定为第一目标属性项,将该第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置;在第二异构系统的各数据库表中,判断是否有第二数据库表,该第二数据库表存在存储有该预设样本集中每个数据对象的该第一属性项的属性内容的第二位置,若存在该第二位置,将该第二位置所在的第二数据库表的表项确定为第二目标属性项,将该第二目标属性项所存储的所有属性内容的位置确定为第二目标属性项位置,其中,该每个数据对象具有多个属性项,并且,每个数据库表的各属性项互不相同;将该第一目标属性项位置与该第二目标属性项位置建立关联;将该第一目标属性项位置存储的属性内容,与该第二目标属性项位置存储的属性内容,关联为该第一异构系统与该第二异构系统的同义数据。可选地,该在第一异构系统的各数据库表中,判断是否有第一数据库表,该第一数据库表存在存储有预设样本集中每个数据对象的第一属性项的属性内容的第一位置之前,该方法还包括:将该预设样本集中多个数据对象,存储在该第一异构系统的各数据库表的对应位置;将该预设样本集中多个数据对象,存储在该第二异构系统的各数据库表的对应位置;监测该第一异构系统的各数据库表的对应位置和该第二异构系统的各数据库表的对应位置。可选地,在该监测该第一异构系统的各数据库表的对应位置和该第二异构系统的各数据库表的对应位置之后,该方法还包括:将该第一数据库表与该第二数据库表建立关联。可选地,该将该第一数据库表与该第二数据库表建立关联,包括:当查找到该第一数据库表为M个、该第二数据库表为N个时,建立该第一异构系统的M个该第一数据库表,与该第二异构系统的N个该第二数据库表的关联,其中,该M、N均为大于或等于1的自然数。可选地,该在第一异构系统的各数据库表中,判断是否有第一数据库表,该第一数据库表存在存储有预设样本集中每个数据对象的第一属性项的属性内容的第一位置,包括:在该第一异构系统的各数据库表中,通过查找该预设样本集中各数据对象的该第一属性项的属性内容的存储位置,判断是否有第一数据库表,该第一数据库表存在存储有该预设样本集中每个数据对象的该第一属性项的属性内容的第一位置;相应的,该在第二异构系统的各数据库表中,判断是否有第二数据库表,该第二数据库表存在存储有该预设样本集中每个数据对象的该第一属性项的属性内容的第二位置,包括:在该第二异构系统的各数据库表中,通过查找该预设样本集中各数据对象的该第一属性项的属性内容的存储位置,判断是否有第二数据库表,该第二数据库表存在存储有该预设样本集中每个数据对象的该第一属性项的属性内容的第二位置。可选地,该将该第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置,包括:若该第一异构系统的各数据库表中的表项以列的形式存储所有属性内容时,M个该第一数据库表的每个该第一目标属性项存储所有属性内容的位置形成M列位置,将该M列位置确定为该第一目标属性项位置,该M为大于或等于1的自然数;相应地,该将该第二目标属性项所存储的所有属性内容的位置确定为第二目标属性项位置,包括:若该第二异构系统的各数据库表中的表项以列的形式存储所有属性内容时,N个该第二数据库表的每个该第二目标属性项存储所有属性内容的位置形成N列位置,将该N列位置确定为该第二目标属性项位置,该N为大于或等于1的自然数;该将该第一目标属性项位置与该第二目标属性项位置建立关联,包括:将该M列位置与该N列位置建立关联。可选地,该将该第一目标属性项位置存储的属性内容,与该第二目标属性项位置存储的属性内容,关联为该第一异构系统与该第二异构系统的同义数据,包括:将该M列位置存储的属性内容与该N列位置存储的属性内容,关联为该第一异构系统与该第二异构系统的同义数据,其中,该M、N均为大于等于1的自然数。可选地,该将该第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置,包括:若该第一异构系统的各数据库表中的表项以列的形式存储所有属性内容时,M个该第一数据库表的每个该第一目标属性项存储所有属性内容的位置形成M列位置,将该M列位置确定为本文档来自技高网
...

【技术保护点】
1.一种关联异构系统同义数据的方法,其特征在于,包括:在第一异构系统的各数据库表中,判断是否有第一数据库表,所述第一数据库表存在存储有预设样本集中每个数据对象的第一属性项的属性内容的第一位置,若存在所述第一位置,将所述第一位置所在的第一数据库的表项确定为第一目标属性项,将所述第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置;在第二异构系统的各数据库表中,判断是否有第二数据库表,所述第二数据库表存在存储有所述预设样本集中每个数据对象的所述第一属性项的属性内容的第二位置,若存在所述第二位置,将所述第二位置所在的第二数据库表的表项确定为第二目标属性项,将所述第二目标属性项所存储的所有属性内容的位置确定为第二目标属性项位置,其中,所述每个数据对象具有多个属性项,并且,每个数据库表的各属性项互不相同;将所述第一目标属性项位置与所述第二目标属性项位置建立关联;将所述第一目标属性项位置存储的属性内容,与所述第二目标属性项位置存储的属性内容,关联为所述第一异构系统与所述第二异构系统的同义数据。

【技术特征摘要】
1.一种关联异构系统同义数据的方法,其特征在于,包括:在第一异构系统的各数据库表中,判断是否有第一数据库表,所述第一数据库表存在存储有预设样本集中每个数据对象的第一属性项的属性内容的第一位置,若存在所述第一位置,将所述第一位置所在的第一数据库的表项确定为第一目标属性项,将所述第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置;在第二异构系统的各数据库表中,判断是否有第二数据库表,所述第二数据库表存在存储有所述预设样本集中每个数据对象的所述第一属性项的属性内容的第二位置,若存在所述第二位置,将所述第二位置所在的第二数据库表的表项确定为第二目标属性项,将所述第二目标属性项所存储的所有属性内容的位置确定为第二目标属性项位置,其中,所述每个数据对象具有多个属性项,并且,每个数据库表的各属性项互不相同;将所述第一目标属性项位置与所述第二目标属性项位置建立关联;将所述第一目标属性项位置存储的属性内容,与所述第二目标属性项位置存储的属性内容,关联为所述第一异构系统与所述第二异构系统的同义数据。2.根据权利要求1所述的方法,其特征在于,所述在第一异构系统的各数据库表中,判断是否有第一数据库表,所述第一数据库表存在存储有预设样本集中每个数据对象的第一属性项的属性内容的第一位置之前,所述方法还包括:将所述预设样本集中多个数据对象,存储在所述第一异构系统的各数据库表的对应位置;将所述预设样本集中多个数据对象,存储在所述第二异构系统的各数据库表的对应位置;监测所述第一异构系统的各数据库表的对应位置和所述第二异构系统的各数据库表的对应位置。3.根据权利要求2所述的方法,其特征在于,在所述监测所述第一异构系统的各数据库表的对应位置和所述第二异构系统的各数据库表的对应位置之后,所述方法还包括:将所述第一数据库表与所述第二数据库表建立关联。4.根据权利要求3所述的方法,其特征在于,所述将所述第一数据库表与所述第二数据库表建立关联,包括:当查找到所述第一数据库表为M个、所述第二数据库表为N个时,建立所述第一异构系统的M个所述第一数据库表,与所述第二异构系统的N个所述第二数据库表的关联,其中,所述M、N均为大于或等于1的自然数。5.根据权利要求1所述的方法,其特征在于,所述在第一异构系统的各数据库表中,判断是否有第一数据库表,所述第一数据库表存在存储有预设样本集中每个数据对象的第一属性项的属性内容的第一位置,包括:在所述第一异构系统的各数据库表中,通过查找所述预设样本集中各数据对象的所述第一属性项的属性内容的存储位置,判断是否有第一数据库表,所述第一数据库表存在存储有所述预设样本集中每个数据对象的所述第一属性项的属性内容的第一位置;相应的,所述在第二异构系统的各数据库表中,判断是否有第二数据库表,所述第二数据库表存在存储有所述预设样本集中每个数据对象的所述第一属性项的属性内容的第二位置,包括:在所述第二异构系统的各数据库表中,通过查找所述预设样本集中各数据对象的所述第一属性项的属性内容的存储位置,判断是否有第二数据库表,所述第二数据库表存在存储有所述预设样本集中每个数据对象的所述第一属性项的属性内容的第二位置。6.根据权利要求4所述的方法,其特征在于,所述将所述第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置,包括:若所述第一异构系统的各数据库表中的表项以列的形式存储所有属性内容时,M个所述第一数据库表的每个所述第一目标属性项存储所有属性内容的位置形成M列位置,将所述M列位置确定为所述第一目标属性项位置,所述M为大于或等于1的自然数;相应地,所述将所述第二目标属性项所存储的所有属性内容的位置确定为第二目标属性项位置,包括:若所述第二异构系统的各数据库表中的表项以列的形式存储所有属性内容时,N个所述第二数据库表的每个所述第二目标属性项存储所有属性内容的位置形成N列位置,将所述N列位置确定为所述第二目标属性项位置,所述N为大于或等于1的自然数;所述将所述第一目标属性项位置与所述第二目标属性项位置建立关联,包括:将所述M列位置与所述N列位置建立关联。7.根据权利要求6所述的方法,其特征在于,所述将所述第一目标属性项位置存储的属性内容,与所述第二目标属性项位置存储的属性内容,关联为所述第一异构系统与所述第二异构系统的同义数据,包括:将所述M列位置存储的属性内容与所述N列位置存储的属性内容,关联为所述第一异构系统与所述第二异构系统的同义数据,其中,所述M、N均为大于等于1的自然数。8.根据权利要求4所述的方法,其特征在于,所述将所述第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置,包括:若所述第一异构系统的各数据库表中的表项以列的形式存储所有属性内容时,M个所述第一数据库表的每个所述第一目标属性项存储所有属性内容的位置形成M列位置,将所述M列位置确定为所述第一目标属性项位置,所述M为大于或等于1的自然数;相应地,所述将所述第二目标属性项所存储的所有属性内容的位置确定为第二目标属性项位置,包括:若所述第二异构系统的各数据库表中的表项以行的形式存储所有属性内容时,N个所述第二数据库表的每个所述第二目标属性项存储所有属性内容的位置形成N行位置,将所述N行位置确定为所述第二目标属性项位置,所述N为大于或等于1的自然数;所述将所述第一目标属性项位置与所述第二目标属性项位置建立关联,包括:将所述M列位置与所述N行位置建立关联。9.根据权利要求8所述的方法,其特征在于,所述将所述第一目标属性项位置存储的属性内容,与所述第二目标属性项位置存储的属性内容,关联为所述第一异构系统与所述第二异构系统的同义数据,包括:将所述M列位置存储的属性内容与所述N行位置存储的属性内容,关联为所述第一异构系统与所述第二异构系统的同义数据,其中,所述M、N均为大于等于1的自然数。10.根据权利要求4所述的方法,其特征在于,所述将所述第一目标属性项所存储的所有属性内容的位置确定为第一目标属性项位置,包括:若所述第一异构系统的各数据库表中的表项以行的形式存储所有属性内容时,M个所述第一数据库表的每个所述第一目标属性项存储所有属性内容的位置形成M行位置,将所述M行位置确定为所述第一目标属性项位置,所述M为大于或等于1的自然数;相应地,所述将所述第二目标属性项所存储的所有属性内容的位置确定为第二目标属性项位置,包括:若所述第二异构系统的各数据库表中的表项以行的形式存储所有属性内容时,N个所述第二数据库表的每个所述第二目标属性项存储所有属性内容的位置形成N行位置,将所述N行位置确定为所述第二目标属性项位置,所述N为大于或等于1的自然数;所述将所述第一目标属性项位置与所述第二目标属性项位置建立关联,包括:将所述M行位置与所述N行位置建立关联。11.根据权利要求10所述的方法,其特征在于,所述将所述第一目标属性项位置存储的属性...

【专利技术属性】
技术研发人员:郭杏荣
申请(专利权)人:北京金山云网络技术有限公司北京金山云科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1