文本属性字段的匹配方法、装置、电子设备及存储介质制造方法及图纸

技术编号:20425328 阅读:39 留言:0更新日期:2019-02-23 08:33
本发明专利技术实施例公开了一种文本属性字段的匹配方法、装置、电子设备及存储介质,该方法包括:获取待匹配文本属性字段的名称;基于所述字段的名称和预设的语义匹配算法推荐语义匹配结果,实现了自动根据语义推荐匹配结果,快速并且准确。解决了现有技术中人工基于经验评估多源异构数据和新旧数据属性字段间的匹配关系进行文字属性字段匹配以及后续的数据迁移等操作效率低的问题。

【技术实现步骤摘要】
文本属性字段的匹配方法、装置、电子设备及存储介质
本专利技术涉及大数据
,尤其涉及一种文本属性字段的匹配方法、装置、电子设备及存储介质。
技术介绍
多源异构数据的接入以及新旧数据中心间的数据迁移等工作,占据了数据中心工程建设中的大部分工作量。这些工作一般采用人工识别手工方式对多源异构数据和新旧数据进行分析,对文本字段进行识别,然后设计文本属性字段处理逻辑,之后再转换为规则配置,最后通过数据处理程序加载人工设置的规则配置进行在线处理,以达到数据汇聚和数据迁移的目的。其中,一个重要的过程是文本属性字段的匹配。现有技术中,人工识别方法一般是人工参考新旧数据中的文本属性字段名称、字段值的特征、字段用途描述等信息,基于经验评估多源异构数据和新旧数据属性字段间的匹配关系,然后,进一步制定数据汇聚和数据迁移中的数据转换规则。该种方法文本字段属性匹配需要有大量人工参与,故工作效率不高。另外,一些传统的改进方法是在工作环节中增加历史经验匹配信息,以辅助人工评估,但由于不能大范围替代人的分析和判别,故对后续的数据迁移等工作的效率提升有限。
技术实现思路
本专利技术提供一种文本属性字段的匹配方法、装置、本文档来自技高网...

【技术保护点】
1.一种文本属性字段的匹配方法,其特征在于,所述方法包括:获取待匹配文本属性字段的名称;基于所述字段的名称和预设的语义匹配算法推荐语义匹配结果。

【技术特征摘要】
1.一种文本属性字段的匹配方法,其特征在于,所述方法包括:获取待匹配文本属性字段的名称;基于所述字段的名称和预设的语义匹配算法推荐语义匹配结果。2.根据权利要求1所述的方法,其特征在于,基于所述字段的名称和预设的语义匹配算法推荐语义匹配结果,包括:基于元数据语义匹配数据库、预设语义识别模型和/或第一历史匹配数据库推荐至少一个语义匹配结果;根据预设的分别与元数据匹配数据库、预设语义识别模型和/或历史匹配数据库对应的权重比例从所述至少一个语义匹配结果中推荐至少一个匹配结果,作为最终推荐的语义匹配结果。3.根据权利要求1所述的方法,其特征在于,基于所述字段的名称和预设的语义匹配算法推荐语义匹配结果之后,所述方法还包括:基于获取到的所述待匹配文本属性字段的数据类型和预设的数据形态匹配算法推荐形态匹配结果;根据预设的融合算法、所述语义匹配结果和所述形态匹配结果推荐最终匹配结果。4.根据权利要求3所述的方法,其特征在于,基于获取到的所述待匹配文本属性字段的数据类型和预设的数据形态匹配算法推荐形态匹配结果,包括:基于获取到的所述待匹配文本属性字段的数据类型、元数据形态匹配数据库和/或预设数据形态识别模型推荐形态...

【专利技术属性】
技术研发人员:万月亮冯宇波火一莽
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1