一种含缺失的多源多标签医学临床数据特征选择方法技术

技术编号:45036998 阅读:15 留言:0更新日期:2025-04-18 17:19
本发明专利技术公开了一种含缺失的多源多标签医学临床数据特征选择方法,包括:1 输入多源的医学临床文本数据;2对文本数据进行缺失数据补全;3 对补全后的文本数据进行过采样获得类平衡的数据;4 采用改进的无限特征选择算法对每个数据源进行源内临床特征选择;5 对不同数据源得到的临床候选特征集进行源间冗余消除,得到消除冗余特征的临床特征选择集。本发明专利技术能从大量的包含缺失的医学临床数据中筛选出重要性高的临床特征,从而能提高异常发现的效率和准确性。

【技术实现步骤摘要】

本专利技术涉及数据挖掘中特征选择的,特别是针对包含缺失数据的医学领域的多源多标签临床数据,提出了一种含缺失的多源多标签医学临床数据特征选择方法


技术介绍

1、随着信息时代的迅速发展和技术的不断进步,医学领域也逐渐进入了一个大数据时代。在这种背景下,多源多标签数据变得愈加普遍。例如,一个患者可能会有来自不同来源的多种检测数据,包括身体特征如体重、血压、心率、血糖水平等,以及诊断特征如症状、检查结果等。这些数据通常与多个异常标签相关。

2、然而,这类多源多标签数据也带来了诸多挑战,尤其是在进行特征选择时。首先,身体特征和诊断特征往往具有高维度,且常伴随大量缺失数据。在实际应用中,由于种种原因,如患者未能接受某些检查、数据记录不全等,某些特征可能缺失,导致不同数据源之间的信息无法有效整合,从而影响模型的整体性能和准确性。例如,一些患者可能缺少某些诊断特征,如影像学检查结果,或身体特征数据存在缺失,如体重未测量,这就要求我们在进行特征选择时,不仅要从不同数据源中选取最具代表性的特征,还要考虑如何有效处理这些缺失数据,避免其对模型结果产生偏差。

本文档来自技高网...

【技术保护点】

1.一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,是按照如下步骤进行:

2.根据权利要求1所述的一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,所述步骤2是按照如下步骤进行:

3.根据权利要求2所述的一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,所述步骤3.1是按照如下步骤进行:

4.根据权利要求3所述的一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,步骤3.2是按照如下步骤进行:

5.根据权利要求4所述的一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,步骤4.1是按照如下步骤...

【技术特征摘要】

1.一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,是按照如下步骤进行:

2.根据权利要求1所述的一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,所述步骤2是按照如下步骤进行:

3.根据权利要求2所述的一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,所述步骤3.1是按照如下步骤进行:

4.根据权利要求3所述的一种含缺失的多源多标签医学临床数据特征选择方法,其特征在于,步骤3.2是按照如下步骤进行:...

【专利技术属性】
技术研发人员:李培培石亚博王海平张海翔胡学钢
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1