【技术实现步骤摘要】
数据处理策略调整方法、装置、设备及存储介质
本专利技术实施例涉及大数据
,尤其涉及一种数据处理策略调整方法、装置、设备及存储介质。
技术介绍
目前在计算机大数据领域,对于采集到的原始大数据,依据接入平台元数据标准和接入策略进行标准化和一系列的预处理,提取到价值密度更高的、支撑应用的各类数据信息,以数据集的形式进行存储。目前对于新接入的数据集,需要对标签策略进行手工调整,才能实现标签策略与当前大数据系统数据相对应,以实现根据标签策略准确地对大数据进行的打标处理。通过手工调整的方式,标签策略更新不及时,存在滞后性,且浪费人力,更新效率和准确性低。
技术实现思路
本专利技术实施例提供一种数据处理策略调整方法、装置、设备及存储介质,以解决标签策略更新不及时,存在滞后性,且更新效率和准确性低的问题,从而实现了标签策略的及时自动更新。第一方面,本专利技术实施例提供了一种数据处理策略调整方法,该方法包括:将目标数据集与预存标签策略进行数据结构匹配;将匹配成功的预存标签策略作为候选标 ...
【技术保护点】
1.一种数据处理策略调整方法,其特征在于,所述方法包括:/n将目标数据集与预存标签策略进行数据结构匹配;/n将匹配成功的预存标签策略作为候选标签策略;/n确定目标数据集与所述候选标签策略匹配成功的第一目标数据结构,以及所述第一目标数据结构的填充率;/n根据所述第一目标数据结构的填充率和所述候选标签策略,确定目标数据集的目标标签策略。/n
【技术特征摘要】
1.一种数据处理策略调整方法,其特征在于,所述方法包括:
将目标数据集与预存标签策略进行数据结构匹配;
将匹配成功的预存标签策略作为候选标签策略;
确定目标数据集与所述候选标签策略匹配成功的第一目标数据结构,以及所述第一目标数据结构的填充率;
根据所述第一目标数据结构的填充率和所述候选标签策略,确定目标数据集的目标标签策略。
2.根据权利要求1所述的方法,其特征在于,所述数据结构包括:数据集编号和/或字段;
相应地,将目标数据集与预存标签策略进行数据结构匹配,包括:
将目标数据集的数据集编号与预存标签策略的数据集编号进行匹配;和/或,将目标数据集的字段与预存标签策略的字段进行匹配。
3.根据权利要求1所述的方法,其特征在于,根据所述第一目标数据结构的填充率和所述候选标签策略,确定目标数据集的目标标签策略,包括:
若目标数据集中第一目标数据结构的填充率不满足要求,则将目标数据集中第二目标数据结构的数据内容,与所述第一目标数据结构的数据内容进行匹配;其中,所述第二目标数据结构为目标数据集中与所述第一目标数据结构不同的数据结构;
采用匹配成功的第二目标数据结构,替换所述候选标签策略中的第一目标数据结构,得到新候选标签策略;
将所述新候选标签策略,作为目标数据集的目标标签策略。
4.根据权利要求3所述的方法,其特征在于,替换所述候选标签策略中的第一目标数据结构,得到新候选标签策略之前,还包括:
确定目标数据集中第二目标数据结构的填充率;
若所述第二目标数据结构的填充率满足要求,则执行替换所述候选标签策略中的第一目标数据结构的步骤。
5.根据权利要求1所述的方法,其特征在于,根据所述第一目标数据结构的填充率和所述候选标签策略,确定目标数据集的目标标签策略,包括:
若目...
【专利技术属性】
技术研发人员:郭贵凤,谢永恒,程强,冯宇波,
申请(专利权)人:北京锐安科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。