基于因果模型的特征提取方法、装置、设备及存储介质制造方法及图纸

技术编号:46596525 阅读:0 留言:0更新日期:2025-10-10 21:29
本发明专利技术属于数据处理技术领域,应用于金融科技领域以及医疗健康领域,公开了一种基于因果模型的特征提取方法、装置、设备及存储介质,该方法包括:获取标签数据,将所述标签数据转换为数值变量集合;将所述数值变量集合输入至因果模型;基于所述因果模型对所述数值化集执行条件独立性检验,生成表征因果关系的图结构;识别所述图结构中的孤立节点及混杂因子节点,删除所述孤立节点和所述混杂因子节点;提取存在因果关联的特征节点集。本发明专利技术提供一种基于因果模型的特征提取方法、装置、设备及存储介质,解决了现有技术中缺乏系统的数值变量转换、条件独立性检验及因果关系结构化呈现手段,难以从海量数据中提取真正关联的特征的问题。

【技术实现步骤摘要】

本专利技术属于数据处理,应用于医疗健康领域以及金融科技领域,尤其涉及一种基于因果模型的特征提取方法、装置、设备及存储介质


技术介绍

1、随着数字化进程加速,数据规模与复杂性急剧增长,高效准确的特征提取成为机器学习模型构建的关键瓶颈。当前主流的特征提取技术多依赖关联分析,通过计算变量间相关性筛选特征,这种方法在处理简单数据时尚可满足基本需求,但在面对高维复杂数据时存在显著缺陷。

2、在金融科技领域,用户交易流水、消费行为、信用记录等数据包含海量标签,关联分析难以区分真正影响风险评估、欺诈检测等目标变量的因果因素。例如,客户某次异常交易时间与历史违约记录可能呈现相关性,但并非导致违约的直接原因,纳入此类冗余特征会增加风控模型计算负担,降低实时响应能力,甚至导致误判。

3、医疗健康领域同样面临挑战,患者电子病历、基因检测、临床检验等数据中,混杂因子众多。如在预测药物疗效时,患者年龄、基础疾病、生活习惯等因素可能与治疗结果存在关联,但并非因果关系,传统方法无法有效剔除这些干扰因素,致使疾病诊断、治疗方案推荐模型精度不足,影响临床决策准确性本文档来自技高网...

【技术保护点】

1.一种基于因果模型的特征提取方法,其特征在于,包括:

2.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述基于所述因果模型对所述数值变量集合执行条件独立性检验,生成表征因果关系的图结构,包括:

3.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述识别所述图结构中的孤立节点及混杂因子节点,删除所述孤立节点和所述混杂因子节点,包括:

4.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述提取存在因果关联的特征节点集,包括:

5.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述提取存...

【技术特征摘要】

1.一种基于因果模型的特征提取方法,其特征在于,包括:

2.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述基于所述因果模型对所述数值变量集合执行条件独立性检验,生成表征因果关系的图结构,包括:

3.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述识别所述图结构中的孤立节点及混杂因子节点,删除所述孤立节点和所述混杂因子节点,包括:

4.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述提取存在因果关联的特征节点集,包括:

5.根据权利要求1所述的基于因果模型的特征提取方法,其特征在于,所述提取存在因果关联的特征节点集之后,还包括:

6.根据权利要求5所述的基于因果模型的特征提取方法...

【专利技术属性】
技术研发人员:汤文迅
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1