【技术实现步骤摘要】
本申请涉及人工智能领域,特别涉及基于频繁项集算法的数据挖掘方法、装置、介质、电子设备、计算机程序产品。
技术介绍
1、在临床试验中,数据的质量直接关系到研究结果的准确性和可靠性。因此,对临床试验采集的数据进行严格的逻辑核查是至关重要的。传统的临床试验数据验证方法往往依赖于静态的数据验证计划(data verification plan,dvp)规则集,这些规则在试验开始前就已经定义好,并且在整个试验过程中保持不变。然而,随着临床试验项目的进行,可能存在的方案变更或者其它业务要求的变化导致的数据字段的增减、数据类型的变更以及数据间关联关系的变化等,静态的dvp规则集逐渐显露出其局限性。
技术实现思路
1、本申请实施例提供了基于频繁项集算法的数据挖掘方法、装置、介质、电子设备、计算机程序产品。
2、第一方面,本申请实施例提供了一种基于频繁项集算法的数据挖掘方法,用于电子设备,所述方法包括:
3、对于获取的历史数据集,使用频繁项集算法挖掘出所述历史数据集的多个频繁项集,其
...【技术保护点】
1.一种基于频繁项集算法的数据挖掘方法,用于电子设备,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,新项与特定频繁项集的关联强度为两者的置信度 ,其中, 为项集 的支持度,并且当所述置信度 大于置信度阈值 时,确定将所述新项 添加到所述特定频繁项集 中形成动态扩展后的特定频繁项集 。
3.根据权利要求2所述的方法,其特征在于,基于业务人员的反馈指标 来调整所述置信度阈值 以得到反馈后的置信度阈值,其中, 为根据反馈指标 计算出的阈值调整量。
4.根据权利要求3所述的方法,其特征在于,对于第一频繁项集 、第二频
...【技术特征摘要】
1.一种基于频繁项集算法的数据挖掘方法,用于电子设备,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,新项与特定频繁项集的关联强度为两者的置信度 ,其中, 为项集 的支持度,并且当所述置信度 大于置信度阈值 时,确定将所述新项 添加到所述特定频繁项集 中形成动态扩展后的特定频繁项集 。
3.根据权利要求2所述的方法,其特征在于,基于业务人员的反馈指标 来调整所述置信度阈值 以得到反馈后的置信度阈值,其中, 为根据反馈指标 计算出的阈值调整量。
4.根据权利要求3所述的方法,其特征在于,对于第一频繁项集 、第二频繁项集 和第三频繁项集 ,当所述第一频繁项集 和所述第二频繁项集 的单层次关联规则 的支持度 以及所述第二频繁项集和所述第三频繁项集 的单层次关联规则 的支持度 均大于支持度阈值 时,确定所述第一频繁项集 、所述第二频繁项集 和所述第三频繁项集 存在多层次关联规则 。
5.根据权利要求4所述的方法,其特征在于,特定关联规则 的调整后频次为,其中, 为所述...
【专利技术属性】
技术研发人员:田永谦,许晨超,
申请(专利权)人:上海艾莎医学科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。