一种基于数据特征的单据数据映射关系确定方法及系统技术方案

技术编号:38808971 阅读:18 留言:0更新日期:2023-09-15 19:47
本发明专利技术公开了一种基于数据特征的单据数据映射关系确定方法及系统,所述方法包括:获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据;对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系。本发明专利技术在获取用户单据的源数据和目标系统所要录入的单据的目标数据后,从源数据和目标数据中提取对应的特征数据,根据特征数据进行字段匹配,以确定源数据和目标数据的映射关系;既可以通过字段确定业务的映射关系,贴合实际业务场景,又可以避免因编码和名称与业务存在差异,而导致映射关系与业务也产生偏差的情况,能提升映射的精度。能提升映射的精度。能提升映射的精度。

【技术实现步骤摘要】
一种基于数据特征的单据数据映射关系确定方法及系统


[0001]本专利技术涉及数据集成的
,尤其涉及一种基于数据特征的单据数据映射关系确定方法及系统。

技术介绍

[0002]随着企业的业务不断增加,不同业务的相关数据也逐渐增加,为了方便管理不同的业务数据,会划分不同的业务系统对业务数据进行存储与管理。例如,关于收款单据的业务对应收款系统,采购业务单据的业务对应采购系统。
[0003]当需要转换或调用不同业务单据的数据时,可以通过确定不同业务单据之间的数据映射关系,根据数据映射关系进行数据提取或数据集成等操作。目前常用的方式是确定源数据与目标数据的字段(例如,编码或名称),根据字段进行自动映射,以确定两个数据之间的映射关系。
[0004]但现有技术有如下技术问题:映射关系随着业务规模复杂度增加而递增,编码和名称难以反映具体的业务,进而无法确定数据具体的映射关系;而且当字段编码和名称与业务存在差异时,确定的映射关于与业务也会产生偏差,降低了映射的精度。

技术实现思路

[0005]本专利技术提出一种基于数据特征的单据数据映射关系确定方法及系统,所述方法可以在获取用户单据的源数据以及目标系统所要录入的单据的目标数据后,根据源数据与目标数据的数据特征进行匹配,以确定数据的映射关系,以提升映射的精度和效率。
[0006]本专利技术实施例的第一方面提供了一种基于数据特征的单据数据映射关系确定方法,所述方法包括:获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;/>[0007]从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据;
[0008]对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系。
[0009]在第一方面的一种可能的实现方式中,所述从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据,包括:
[0010]识别所述源数据的源标识字段以及关于单据信息的源信息字段,将所述源信息字段添加至所述源标识字段,得到源特征数据;
[0011]识别所述目标数据的目标标识字段以及关于单据信息的目标信息字段,将所述目标信息字段添加至所述目标标识字段,得到目标特征数据。
[0012]在第一方面的一种可能的实现方式中,所述对所述源特征数据和所述目标特征数据进行字段匹配得到数据映射关系,包括:
[0013]遍历所述目标特征数据的字段值,得到目标特征字段值;
[0014]从所述源特征数据中筛选与所述目标特征字段值相同的字段值,得到源特征字段
值;
[0015]对所述源特征字段值和所述目标特征字段值进行字段值匹配得到数据映射关系。
[0016]在第一方面的一种可能的实现方式中,在所述获取单据数据的步骤后,所述方法还包括:
[0017]利用语义算法识别所述源数据和所述目标数据在相同业务上相同的字段值,分别得到若干个源业务字段值和若干个目标业务字段值;
[0018]若所述源业务字段值和所述目标业务字段值相同,且若干个所述源业务字段值均不相同,则从所述源数据和所述目标数据提取特征数据。
[0019]本专利技术实施例的第二方面提供了一种基于数据特征的单据数据映射关系确定系统,所述系统包括:获取模块,用于获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;
[0020]特征提取模块,用于从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据;
[0021]确定映射关系模块,用于对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系。
[0022]在第二方面的一种可能的实现方式中,所述特征提取模块,还用于:
[0023]识别所述源数据的源标识字段以及关于单据信息的源信息字段,将所述源信息字段添加至所述源标识字段,得到源特征数据;
[0024]识别所述目标数据的目标标识字段以及关于单据信息的目标信息字段,将所述目标信息字段添加至所述目标标识字段,得到目标特征数据。
[0025]在第二方面的一种可能的实现方式中,所述确定映射关系模块,还用于:
[0026]遍历所述目标特征数据的字段值,得到目标特征字段值;
[0027]从所述源特征数据中筛选与所述目标特征字段值相同的字段值,得到源特征字段值;
[0028]对所述源特征字段值和所述目标特征字段值进行字段值匹配得到数据映射关系。
[0029]在第二方面的一种可能的实现方式中,所述系统还包括:
[0030]字段识别模块,用于利用语义算法识别所述源数据和所述目标数据在相同业务上相同的字段值,分别得到若干个源业务字段值和若干个目标业务字段值;
[0031]字段判断模块,用于若所述源业务字段值和所述目标业务字段值相同,且若干个所述源业务字段值均不相同,则从所述源数据和所述目标数据提取特征数据。
[0032]本专利技术实施例的第三方面提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的基于数据特征的单据数据映射关系确定方法。
[0033]本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行程序,所述计算机可执行程序用于使计算机执行如上所述的基于数据特征的单据数据映射关系确定方法。
[0034]本专利技术实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品在计算机设备上运行时,使得所述计算机设备实现如上所述的基于数据特征的单据数据映射关系确定方法。
[0035]相比于现有技术,本专利技术实施例提供的一种基于数据特征的单据数据映射关系确定方法及系统,其有益效果在于:本专利技术可以在获取用户单据的源数据以及目标系统所要录入的单据的目标数据后,分别从源数据和目标数据中提取对应的特征数据,根据特征数据进行字段匹配,以确定源数据和目标数据的映射关系;一方面可以通过字段确定业务的映射关系,贴合实际业务场景,另一方面可以避免因编码和名称与业务存在差异,而导致映射关系与业务也产生偏差的情况,能提升映射的精度。
附图说明
[0036]图1是本专利技术一实施例提供的一种基于数据特征的单据数据映射关系确定方法的流程示意图;
[0037]图2是本专利技术一实施例提供的一种基于数据特征的单据数据映射关系确定方法的流程示意图;
[0038]图3是本专利技术一实施例提供的一种基于数据特征的单据数据映射关系确定方法的流程示意图;
[0039]图4是本专利技术一实施例提供的一种基于数据特征的单据数据映射关系确定方法的流程示意图;
[0040]图5是本专利技术一实施例提供的一种基于数据特征的单据数据映射关系确定方法的操作流程图;
[0041]图6是本专利技术一实施例提供的一种基于数据特征的单据数据映射关系确定系统的结构示意图。
具体实施方式
[0042]下面将结合本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于数据特征的单据数据映射关系确定方法,其特征在于,所述方法包括:获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据;对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系。2.根据权利要求1所述的基于数据特征的单据数据映射关系确定方法,其特征在于,所述从所述源数据和所述目标数据提取特征数据,分别得到源特征数据和目标特征数据,包括:识别所述源数据的源标识字段以及关于单据信息的源信息字段,将所述源信息字段添加至所述源标识字段,得到源特征数据;识别所述目标数据的目标标识字段以及关于单据信息的目标信息字段,将所述目标信息字段添加至所述目标标识字段,得到目标特征数据。3.根据权利要求1所述的基于数据特征的单据数据映射关系确定方法,其特征在于,所述对所述源特征数据和所述目标特征数据进行字段值匹配得到数据映射关系,包括:遍历所述目标特征数据的字段值,得到目标特征字段值;从所述源特征数据中筛选与所述目标特征字段值相同的字段值,得到源特征字段值;对所述源特征字段值和所述目标特征字段值进行字段值匹配得到数据映射关系。4.根据权利要求1

3任意一项所述的基于数据特征的单据数据映射关系确定方法,其特征在于,在所述获取单据数据的步骤后,所述方法还包括:利用语义算法识别所述源数据和所述目标数据在相同业务上相同的字段值,分别得到若干个源业务字段值和若干个目标业务字段值;若所述源业务字段值和所述目标业务字段值相同,且若干个所述源业务字段值均不相同,则从所述源数据和所述目标数据提取特征数据。5.一种基于数据特征的单据数据映射关系确定系统,其特征在于,所述系统包括:获取模块,用于获取单据数据,所述单据数据包括:用户单据的源数据以及目标系统的目标数据;特征提取模块,用于从所述源数据和所述目标数据提取特征数据...

【专利技术属性】
技术研发人员:杨建辉胡慧君杨发胡启程江婉玲
申请(专利权)人:金蝶软件中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1