数据融合方法及计算机存储介质技术

技术编号:20724698 阅读:31 留言:0更新日期:2019-03-30 17:39
本发明专利技术实施例提供了一种数据融合方法及计算机存储介质,其中,所述数据融合方法包括:获取多个业务数据表中每个业务数据表的业务数据项的信息;根据每个业务数据表中的业务数据项的信息,生成与所述多个业务数据表对应的业务规则;根据所述业务规则,生成对应的谓词规则,并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。通过本发明专利技术实施例,可以有效地对业务数据进行整合和梳理,提高业务数据的利用效果。

【技术实现步骤摘要】
数据融合方法及计算机存储介质
本专利技术实施例涉及计算机
,尤其涉及一种数据融合方法及计算机存储介质。
技术介绍
目前,企业的发展越来越依赖于通过计算机和网络系统实现管理。然而,企业的高速发展使得企业内部存在很多遗留系统和遗留数据,特别是对于大公司和运营时间比较长的公司,这样的系统和数据会非常多。以包括多条业务线的企业系统为例,可能存在着诸如:1)不同业务线记录的用户信息有差别;2)不同业务线的技术架构有很大差别,导致原始数据的存储分散,等等问题。由此,导致数据的整合和梳理极端困难,无法对已有数据进行有效利用。
技术实现思路
有鉴于此,本专利技术实施例提供了一种数据融合方法及计算机存储介质,以解决上述问题。根据本专利技术实施例的一个方面,提供了一种数据融合方法,包括:获取多个业务数据表中每个业务数据表的业务数据项的信息;根据每个业务数据表中的业务数据项的信息,生成与所述多个业务数据表对应的业务规则;根据所述业务规则,生成对应的谓词规则,并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。根据本专利技术实施例的另一个方面,还提供了一种计算机可读介质,所述计算机存储介质存储有:用于获取多个业务数据表中每个业务数据表的业务数据项的信息的指令;用于根据每个业务数据表中的业务数据项的信息,生成与所述多个业务数据表对应的业务规则的指令;用于根据所述业务规则,生成对应的谓词规则,并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令。通过本专利技术实施例,针对某一业务中具有关联关系的多个业务数据表,为这些业务数据表生成对应的业务规则,进而,根据生成的业务规则生成谓词规则,并使用谓词规则进行多个业务数据表中的业务数据融合。通过生成业务规则,可以对多个业务数据表中的业务数据进行关联;而使用谓词规则对业务数据进行数据融合,则实现了对业务数据表中的数据的归纳和梳理,获取其中的用户的用户特征。可见,通过本专利技术实施例,可以有效地对业务数据进行整合和梳理,提高业务数据的利用效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例一的一种数据融合方法的步骤流程图;图2是根据本专利技术实施例二的一种数据融合方法的步骤流程图。具体实施方式当然,实施本专利技术实施例的任一技术方案必不一定需要同时达到以上的所有优点。为了使本领域的人员更好地理解本专利技术实施例中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术实施例一部分实施例,而不是全部的实施例。基于本专利技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本专利技术实施例保护的范围。实施例一参照图1,示出了根据本专利技术实施例一的一种数据融合方法的步骤流程图。本实施例的数据融合方法包括以下步骤:步骤S102:获取多个业务数据表中每个业务数据表的业务数据项的信息。如前所述,一个企业系统中可能包括多个业务线,每个业务线可能使用一个或多个(如无特别说明,本专利技术实施例中,“多个”意指两个及两个以上)数据库存储业务数据,具有记录业务数据的多个业务数据表。当有多个数据库时,这些数据库的类型可能相同也可能不同,也可能部分相同。无论数据库的类型为何,均可适用于本专利技术实施例的方案。每个业务数据表中具有相应的业务数据项,在实际应用中,业务数据项可以采用任意适当形式,例如可以为字段的形式,如一张SQL数据表中的各个字段,每个记录包括对应于各个业务数据项的值。例如,以业务数据表为下表1中的学生信息表为例,表1学生信息表如上表1所示,学生的基本信息存在一张SQL数据表中,每一个记录对应一个学生的信息。其中包含的学生信息有:“student_id”、“student_name”、“student_city”、“grade”、“course_id”等多个字段。从数据库中获取一个学生记录对应的格式为:{'student_id':'1','student_name':'刘森','student_city':'北京','grade':'3','course_id':'001'}。上表1中,“student_id”、“student_name”、“student_city”、“grade”、“course_id”为业务数据项,表1中包括除第一行之外的、序号为1~5的五条记录,各条记录包括对应于业务数据项的值,即表中第2~6行的内容。步骤S104:根据每个业务数据表中的业务数据项的信息,生成与所述多个业务数据表对应的业务规则。其中,所述业务规则用于指示以下信息至少之一:业务数据项之间的关联关系、业务数据表之间的关联关系,以及如何对业务数据进行处理。例如,根据“student_id”,即可获得“student_name”、“student_city”、“grade”、“course_id”等多个字段的值;再例如,根据学生信息表可以关联学生成绩表;又例如,可以通过学生信息表中的“student_id”字段查找其它数据表,以根据处理目的获得其它数据表中相应的业务数据,等等。步骤S106:根据所述业务规则,生成对应的谓词规则,并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。谓词规则的基本思想为以谓词逻辑来对业务进行表示,并且基于业务自有场景进行业务的规则制定。谓词逻辑是一种形式语言,其目的是将数学中的逻辑论证符号化,将自然特征事物之间共同的特征抽象出来进一步的表示,以方便后续的分析和推理。一个谓词逻辑基本组成部分是谓词符号、变量符号、函数符号和常量符号,并用括号,逗号等进行分隔。谓词符号为规定定义域内的一个相应关系;常量符号为最简单的项,为论域内的物体或者实体。变量符号也是项,不明确涉及是哪一个具体的实体;函数符号代表论域内的函数,是从论域内一个实体到另一个实体的映射。例如:所有的学生都需要做作业。对应的谓词逻辑为其中Student和Homework为谓词符号,为每个学生个体对应的属性和动作,x为变量符号表示一个不确定的学生,Student(x)和Homework(x)都是一个函数符号,代表的是学生x和学生做作业这样的关系映射。符号<-以及符号与(∧)等都属于连词,对多个谓词逻辑进行组合,以表达更加复杂的含义。如:Level(x)<-[belongto<question<id,x>∧frame<Course.Level.question>∧in_memory<Student,做题>]代表的为对任意学生x,如果他回答的题目id满足给定的ID,且对应的问题属于课程中对应的Level内容,并且将题目完成正确,那么这个学生就完成了关卡的内容。本专利技术实施例中,业务规则可以由一系列的子规则构成,可以理解为一个子规则集合。在一个示例中,首先,使用自然语言对业务规则进行阐述如下所示:子规则1:关键标识(main_id)and学生信息(student_info)and学生标识(stud本文档来自技高网...

【技术保护点】
1.一种数据融合方法,其特征在于,包括:获取多个业务数据表中每个业务数据表的业务数据项的信息;根据每个业务数据表中的业务数据项的信息,生成与所述多个业务数据表对应的业务规则;根据所述业务规则,生成对应的谓词规则,并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。

【技术特征摘要】
1.一种数据融合方法,其特征在于,包括:获取多个业务数据表中每个业务数据表的业务数据项的信息;根据每个业务数据表中的业务数据项的信息,生成与所述多个业务数据表对应的业务规则;根据所述业务规则,生成对应的谓词规则,并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。2.根据权利要求1所述的方法,其特征在于,所述根据每个业务数据表中的业务数据项的信息,生成与所述多个业务数据表对应的业务规则,包括:根据每个业务数据表中的业务数据项的信息,获得多个业务数据表之间的关联关系;根据所述关联关系,生成与所述多个业务数据表对应的业务规则。3.根据权利要求2所述的方法,其特征在于,所述业务数据项包括业务标识项;所述根据每个业务数据表中的业务数据项的信息,获得多个业务数据表之间的关联关系,包括:根据每个业务数据表中的业务数据项的信息,使用所述业务标识项获得多个业务数据表之间的关联关系。4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述业务规则,生成对应的谓词规则,包括:根据所述业务规则和所述业务数据项的信息,提取谓词因子;根据提取的谓词因子,生成谓词规则。5.根据权利要求4所述的方法,其特征在于,所述根据提取的谓词因子,生成谓词规则,包括:根据提取的谓词因子中的部分因子,以及每个业务数据表中的业务标识项的信息,生成至少一个第一子规则;根据所述第一子规则中的部分或全部子规则,生成至少一个第二子规则;根据生成的所述第一子规则和所述第二子规则,生成所述谓词规则。6.根据权利要求5所述的方法,其特征在于...

【专利技术属性】
技术研发人员:陈旷龙阳雨付国为
申请(专利权)人:北京新唐思创教育科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1