【技术实现步骤摘要】
一种数据处理方法、数据处理装置、设备及存储介质
[0001]本申请涉及但不限于计算机领域,尤其涉及一种数据处理方法、数据处理装置、电子设备及计算机可读存储介质。
技术介绍
[0002]经验来自实践,智慧源于基层。在我们的日常工作中,经常需要挖掘、选树、宣传基层工作中的优秀案例和最佳实践,形成以点带面的示范效应。相关技术中的对案例的筛选工作依靠人工鉴别,筛选结果受人为主观因素影响较大,准确性低。
技术实现思路
[0003]有鉴于此,本申请提供一种数据处理方法、数据处理装置、电子设备及计算机可读存储介质,解决了相关技术中的对案例的筛选工作依靠人工鉴别,筛选结果受人为主观因素影响较大,准确性低的问题。
[0004]为达到上述目的,本申请的技术方案是这样实现的:
[0005]一种数据处理方法,所述方法包括:
[0006]以参考数据集中各个类别的数据的属性组建属性集;
[0007]从所述属性集中筛选出候选属性子集;其中,所述候选属性子集是所述属性集中与所述各个类别的数据的值组成的值域集之 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:以参考数据集中各个类别的数据的属性组建属性集;从所述属性集中筛选出候选属性子集;其中,所述候选属性子集是所述属性集中与所述各个类别的数据的值组成的值域集之间满足互信息条件的子集;基于所述各个类别的分类标识,分析所述候选属性子集中各个属性子集之间的关联规则,定位具有目标关联规则的频繁项集;其中,所述具有目标关联规则的频繁项集中每一项集的支持度大于支持度阈值,且所述每一项集置信度大于置信度阈值,所述每一项集包括至少两个属性子集。2.根据权利要求1所述的方法,其特征在于,所述基于所述各个类别的分类标识,分析所述候选属性子集中各个属性子集之间的关联规则,定位具有目标关联规则的频繁项集,包括:获取所述候选属性子集中每一属性子集对应的分类标识,并从所述各个类别的数据中确定所述分类标识对应的数据;计算所述候选属性子集中第i属性子集中的第j数据,在所述第i属性子集具有的分类标识的数据集中的出现次数;其中,i和j为正整数;删除所述候选属性子集中所述出现次数小于次数阈值的属性子集,得到参考属性子集;对所述参考属性子集进行自连接操作,得到多个候选频繁项集;计算所述多个候选频繁项集中,每一候选频繁项集的支持度和每一候选频繁项集的置信度;基于所述每一候选频繁项集的支持度和所述每一候选频繁项集的置信度,从所述多个候选频繁项集中筛选出所述频繁项集。3.根据权利要求1所述的方法,其特征在于,所述从所述属性集中筛选出候选属性子集,包括:获取所述属性集与所述值域集之间的第一互信息量、以及所述属性集中每一属性子集对应的权重系数;基于所述权重系数和所述第一互信息量,从所述属性集中筛选出候选属性子集。4.根据权利要求3所述的方法,其特征在于,所述基于所述权重系数和所述第一互信息量,从所述属性集中筛选出候选属性子集,包括:从所述属性集中的每一属性子集对应的权重系数中确定最大的权重系数,并确定所述最大的权重系数对应的第一属性子集;获取所述第一属性子集与所述值域集的第二互信息量;基于所述第一互信息量和所述第二互信息量,确定所述候选属性子集。5.根据权利要求4所...
【专利技术属性】
技术研发人员:秦晨普,陈健,王晓进,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。