当前位置: 首页 > 专利查询>东北大学专利>正文

多源数据字典融合方法及装置、介质、设备制造方法及图纸

技术编号:40171509 阅读:27 留言:0更新日期:2024-01-26 23:41
本申请公开了一种多源数据字典融合方法。方法包括:获取待融合数据字典及数据逻辑描述信息;基于数据逻辑描述信息在待融合数据字典的数据字典表中提取第一关键词;基于数据字典表中字段的词频在数据字典表中提取第二关键词,并融合第一关键词及第二关键词得到目标关键词;计算目标关键词的二维加权编辑距离,对数据字典表进行初次分类得到数据字典表的粗类别;在同一粗类别中,计算字段的多维加权编辑距离,对数据字典表进行再次分类得到数据字典表的细类别;在同一细类别中,计算数据字典表的表格相似度,并根据表格相似度融合数据字典表。本申请解决了依赖设计人员对数据字典的设计文档进行修改的方案中存在的人员成本高、周期长等问题。

【技术实现步骤摘要】

本申请涉及数据处理领域,尤其是涉及到一种多源数据字典融合方法及装置、介质和设备。


技术介绍

1、数据库设计时除了考虑用户数据外,还需要设计很多非用户数据信息。例如,数据项的长度、类型、用户标识符、主/外键、数据以及文件间的联系等等,这些非用户数据是整个数据库系统的情报系统,为了使数据库的设计、实现、运行、维护、扩充有一个共同遵循的标准和依据,并且也为了保证数据库的共享性、安全性、完整性、一致性、有效性、可恢复性以及可扩充性,人们将这些信息集中保存在了数据字典里。近年来,目前国内外基层社会治理领域,多使用数据字典作为辅助治理工具。

2、然而当数据字典的应用范围出现变化或需要两个乃至多个数据字典共同完成业务时,由于数据字典没有统一数据标准和命名规范,存在数据不一致性和冗余等问题,例如在政府部门或公司中数据库所设计的数据字典,与在跨部门联动所应用环境的设计是存在歧义以及冗余的,因此,在联合系统上线阶段,已经设计应用的数据字典在集成到指定联动系统中时,需要进行原数据字典与新系统的适配,以保证系统运行的准确性。在实际业务场景中,一般采用依赖原数据字典设计本文档来自技高网...

【技术保护点】

1.一种多源数据字典融合方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,计算不同待融合数据字典中的目标关键词之间的二维加权编辑距离,包括:

3.根据权利要求1所述的方法,其特征在于,在同一粗类别中。计算所述字段之间的多维加权编辑距离,包括:

4.根据权利要求3所述的方法,其特征在于,在根据所述第二权重计算所述字段之间的多维加权编辑距离之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据所述表格相似度融合所述数据字典表,得到目标数据字典,包括:

6.根据权利要求5所述的方法,其特征在于...

【技术特征摘要】

1.一种多源数据字典融合方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,计算不同待融合数据字典中的目标关键词之间的二维加权编辑距离,包括:

3.根据权利要求1所述的方法,其特征在于,在同一粗类别中。计算所述字段之间的多维加权编辑距离,包括:

4.根据权利要求3所述的方法,其特征在于,在根据所述第二权重计算所述字段之间的多维加权编辑距离之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据所述表格相似度融合所述数据字典表,得到目标数据字典,包括:

6.根据权利要求5...

【专利技术属性】
技术研发人员:杨万哲王庆王历
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1