一种针对数据字段和数据标准的匹配方法及可读存储介质组成比例

技术编号:41310630 阅读:20 留言:0更新日期:2024-05-13 14:54
本发明专利技术公开了一种针对数据字段和数据标准的匹配方法及可读存储介质,包括:通过获取待匹配数据字段和预先构建的匹配向量数据库进行操作。接着,将待匹配数据字段进行向量化得到数据字段向量,并在匹配向量数据库中进行匹配,得到多个初始匹配结果。利用预先确定的待匹配数据字段对应的血缘关系,对这些初始匹配结果进行优化,得到中间匹配结果。然后,调用预先训练的检测大模型对中间匹配结果进行检测,当检测通过时,将中间匹配结果作为目标匹配结果输出。最后,输出的目标匹配结果包括待匹配数据字段和与待匹配数据字段存在匹配关系的目标数据标准,如此设计,实现了自动化、高效且可靠的数据字段和数据标准匹配,提升了数据处理的精度和效率。

【技术实现步骤摘要】

本专利技术涉及数据库管理,具体而言,涉及一种针对数据字段和数据标准的匹配方法及可读存储介质


技术介绍

1、在处理大规模数据时,需要对不同来源、不同格式的数据进行整合,其中一个重要环节就是数据字段与数据标准的匹配。传统的数据匹配方法主要依赖人工处理或者简单的机器学习算法,这种方式效率低且难以适应数据量的增长。因此,急需一种自动化、高效且可靠的数据字段和数据标准匹配方法。


技术实现思路

1、本专利技术的目的在于提供一种针对数据字段和数据标准的匹配方法及可读存储介质。

2、第一方面,本专利技术实施例提供一种针对数据字段和数据标准的匹配方法,包括:

3、获取待匹配数据字段和预先构建的匹配向量数据库,所述匹配向量数据库是通过预先采集的多个数据标准进行向量化后构建的,所述数据标准用于定义数据字段的数据关系表属性;

4、将所述待匹配数据字段进行向量化,得到数据字段向量;

5、基于所述数据字段向量在所述匹配向量数据库中进行匹配,得到多个初始匹配结果;>

6、基于预先本文档来自技高网...

【技术保护点】

1.一种针对数据字段和数据标准的匹配方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述匹配向量数据库是通过以下方式构建的,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述基于所述数据字段向量在所述匹配向量数据库中进行匹配,得到多个初始匹配结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述血缘关系包括数据字段之间的数据流转关系,所述基于预先确定的所述待匹配数据字段对应的血缘关系,对所述多个初始匹配结果进行优化,得到中间匹配结果,包括:

...

【技术特征摘要】

1.一种针对数据字段和数据标准的匹配方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述匹配向量数据库是通过以下方式构建的,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述基于所述数据字段向量在所述匹配向量数据库中进行匹配,得到多个初始匹配结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述血缘关系包括数据字段之间的数据流转关系,所述基于预先确定的所述待匹配数据字段对应的血缘关系,对所述多个初始匹配结果进行优化,得到中间匹配结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述结合血缘图算法和所述血缘信息对所述...

【专利技术属性】
技术研发人员:李同刘大伟陶征霖常雷姚佳丽霍瑞龙宋宜旭
申请(专利权)人:北京偶数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1