【技术实现步骤摘要】
本公开总体说来涉及数据处理领域,更具体地讲,涉及一种表拼接方法、装置、存储介质和系统。
技术介绍
1、在目前涉及到大数据的相关应用中,往往需要借助人工智能模型对大数据进行分析。在应用人工智能模型分析大数据的过程中,涉及到大量表格数据操作,而表拼接是表格数据操作中不可或缺的一个环节。具体而言,表拼接是指将分散的表聚合在一起,通过表拼接能够将各个表所承载的业务信息汇集至同一张表中,便于后续对业务信息的分析应用。
2、但是在相关技术中,当主表和副表的表关系是一对多的时候,往往是对副表进行简单的聚合操作后直接拼接至主表,导致在后续进行数据分析时,无法充分利用副表中的信息。
技术实现思路
1、本公开提供一种表拼接方法、装置、存储介质和系统,用于至少解决部分的上述问题。
2、根据本公开的一方面,提供一种表拼接方法,包括:针对主表对应的任意一个副表,基于所述主表和该副表之间的连接键,将所述主表中各主表数据对象的第一标签拼接至该副表中,得到包含第二标签的副表;利用预设的标签分类模型
...【技术保护点】
1.一种表拼接方法,其特征在于,包括:
2.如权利要求1所述的表拼接方法,其特征在于,任意一个主表数据对象的第一标签表示该主表数据对象是否属于目标类别,任意一个副表数据对象的预测结果表示该副表数据对象属于所述目标类别的概率。
3.如权利要求1所述的表拼接方法,其特征在于,所述主表数据对象包括多个数据项,其中,所述第一标签为所述多个数据项中的一个数据项。
4.如权利要求1所述的表拼接方法,其特征在于,所述副表统计信息包括最大值、最小值、中位数、均值、方差、计数中的至少一个。
5.如权利要求1所述的表拼接方法,其特征在于,所
...【技术特征摘要】
1.一种表拼接方法,其特征在于,包括:
2.如权利要求1所述的表拼接方法,其特征在于,任意一个主表数据对象的第一标签表示该主表数据对象是否属于目标类别,任意一个副表数据对象的预测结果表示该副表数据对象属于所述目标类别的概率。
3.如权利要求1所述的表拼接方法,其特征在于,所述主表数据对象包括多个数据项,其中,所述第一标签为所述多个数据项中的一个数据项。
4.如权利要求1所述的表拼接方法,其特征在于,所述副表统计信息包括最大值、最小值、中位数、均值、方差、计数中的至少一个。
5.如权利要求1所述的表拼接方法,其特征在于,所述利用预设的标签分类模型对所述包含第二标签的副表进行处理,得到该副表中各副表数据对象的预测结果,包括:
6.如权利要求1至5中任一项所述的表拼接方法,其特征在于,所述...
【专利技术属性】
技术研发人员:蔡恒兴,涂威威,
申请(专利权)人:第四范式北京技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。