【技术实现步骤摘要】
基于机器学习对关联规则进行评估的方法及装置
[0001]本专利技术涉及人工智能
,尤其是涉及到基于机器学习对关联规则进行评估的方法、装置、计算机设备及计算机存储介质。
技术介绍
[0002]关联分析是一种常用的挖掘算法,用来挖掘数据之间的内在关联,可应用在生活中很多应用场景,例如,在购物场景中,通过关联规则发现群体购买习惯的内在共性,指导超市产品摆放,在医疗场景中,通过关联规则挖掘病患消费医疗项目的可能,指导医生病例诊断。
[0003]通常情况下,关联规则可以由领域专家提出,还可以通过数据挖掘得到满足有些度量值,如置信度、支持度以及提升度等要求的候选集,再经过专家确认合理性。考虑到关联规则中项目是由不同因素决定的,这些因素的共同作用对项目之间关系的评估具有偏差,例如,关联规则为“口腔麻醉
→
根管”这里“口腔麻醉”可能是由于患者做了“拔牙术”或者“根管治疗”导致的,而“根管”仅仅因为患者做了“根管治疗”导致,使得“口腔麻醉”推理出“根管”是有一定偏差的,使得上述关联规则的挖掘过程存在以下两点不足 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习对关联规则进行评估的方法,其特征在于,所述方法包括:使用项目共现条件从项目集合中挖掘关联规则,所述关联规则包括前件和后件,所述项目共现条件为前件和后件中项目同时出现;利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示,所述文本信息编码器用于对所述关联规则中后件是否出现进行预测,所述前件预测机用于对所述关联规则中前件是否出现进行预测;响应于关联规则的评估指令,根据所述项目文本信息的编码向量表示对每条关联规则进行评估,得到反映关联规则中前件和后件之间因果关系的评估结果。2.根据权利要求1所述的方法,其特征在于,所述项目共现条件为关联规则中前件与后件同时出现,所述使用项目共现条件从项目集合中挖掘关联规则,具体包括:对项目集合所包含频繁项目子集进行全排列;针对所述频繁项目子集生成候选关联规则,并利用预设参数指标对所述候选关联规则进行过滤,得到符合预设条件的候选规则,所述参数指标至少包括支持度和置信度,所述支持度为前件和后件的共现频率,所述置信度为支持度与前件概率的比值。3.根据权利要求1所述的方法,其特征在于,在所述利用预先训练的文本信息编码器和前件预测机对收集的项目文本信息进行特征提取,得到项目文本信息的编码向量表示之前,所述方法还包括:针对每条关联规则,使用预先确定所述前件和所述后件是否在项目文本信息中出现作为标签数据;将携带有标签数据的项目文本信息输入至第一网络模型中进行训练,构建文本信息编码器,所述文本信息编码器的优化目标为最大化预测关联规则中后件是否在项目文本信息中出现;将所述第一网络模型输出项目文本信息的编码向量表示以及关联规则中后件是否在项目文本信息中出现的预测值输入至第二网络模型进行训练,构建前件预测机,所述前件预测机的优化目标为最大化预测关联规则中前件是否在项目文本信息中出现。4.根据权利要求3所述的方法,其特征在于,所述文本信息编码器与所述前件预测机在训练过程中进行对抗学习,以使得项目文本信息中去除与关联规则中前件相关的信息,并保留关联规则中前件与后件相关的信息。5.根据权利要求1
‑
4中任一项所述的方法,其特征在于,所述根据所述项目文本信息的编码向量表示对每条关联规则进行评估,得到反映关联规则中前件和...
【专利技术属性】
技术研发人员:蒋雪涵,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。