System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于CL-FCM的风湿免疫疾病数据预处理方法及系统技术方案_技高网

基于CL-FCM的风湿免疫疾病数据预处理方法及系统技术方案

技术编号:39964785 阅读:7 留言:0更新日期:2024-01-09 00:19
本发明专利技术提出了一种基于CL‑FCM的风湿免疫疾病数据预处理方法及系统,方法包括:基于风湿免疫疾病临床数据和专家数据库确定与疾病诊断相关的属性;筛选可用信息,去除冗余信息,对各属性进行编码转化、缺失值处理;利用交叉熵、肘部法确定最佳聚类数目;对单个或多个属性进行数据增强,形成多个视图聚类结果,计算整体损失,更新原始特征表示;利用FCM算法,对更新后的数据集聚类,得到聚类结果能直接用于下游预测模型中进行疾病预测,本发明专利技术能够在面对有大量相关属性的数据集时,准确增强关键属性,提高疾病诊断效率;能够为后续推理模型减少冗余特征,减少计算量,能够帮助医生更全面地了解风湿疾病的关键特征。

【技术实现步骤摘要】

本专利技术融合了医学、信息科学以及计算机应用等领域的知识,专利技术了一种基于cl-fcm的风湿免疫疾病数据预处理方法及系统。


技术介绍

1、风湿免疫疾病是一类涉及关节、骨骼、肌肉和免疫系统的疾病,这类疾病包含100多种疾病,最常见的有类风湿性关节炎、强直性脊柱炎、系统性红斑狼疮、骨关节炎、痛风等。风湿免疫疾病症状和表现多种多样,且不同疾病可能有相似的症状和体征,使得诊断变得困难。风湿免疫疾病的诊断通常需要综合多种数据源,包括临床数据、辅助检查、病史等,这些数据具有不同的维度和特征。为了更好地确定患者所患风湿免疫疾病的类型,目前经常采用基于大数据分析预测模型分析患者各个症状和症状的表现,结合患者的临床数据、辅助检查、病史等数据资料,辅助医生进行诊断,因此,需要对庞杂的临床数据进行预处理,为基于大数据分析预测模型提供基础数据。


技术实现思路

1、本专利技术提出一种基于cl-fcm的风湿免疫疾病数据预处理方法,对风湿患者的过往病历信息进行抽取,利用编码转化、缺失值处理、模糊c均值算法和多视图对比学习机制等技术充分利用患者信息,辅助医生治疗,有助于提高医疗诊治效率。

2、为实现上述目的,本专利技术所采用的技术方案为:一种基于cl-fcm的风湿免疫疾病数据预处理方法,包括以下步骤:

3、基于风湿免疫疾病临床数据和专家数据库确定与疾病诊断相关的属性;

4、基于所述疾病诊断相关的属性,筛选收集信息中患者可用信息,包括文本数据和数值数据,去除冗余信息,构成数据集

5、基于所述数据集,对各属性进行编码转化和缺失值处理,得到完整的数据集;

6、利用肘部法则、xie-beni指数以及交叉熵指标确定所述完整的数据集的最佳聚类数目;

7、基于最佳聚类数目,对单个或多个属性进行数据增强,形成多个视图聚类结果,根据多个视图聚类结果,计算对比损失和聚类损失,反向传播更新原始特征表示,得到更新原始特征表示后的数据集;

8、利用fcm算法,对更新原始特征表示后的数据集进行最终聚类,得到最终聚类数目和聚类中心。

9、进一步的,基于风湿免疫疾病临床数据和专家数据库确定与疾病诊断相关的属性,采用文献分析、基于专业风湿免疫科医生沟通和分析现有医疗数据,选择基本信息、家族史、专科情况、实验室检查结果和诊断结果作为与疾病诊断相关的属性,所述与疾病诊断相关的属性具体如下,

10、基本信息:性别和年龄;

11、家族史:是否患有与患者相似疾病;

12、专科情况:僵晨>=30min、受累关节、受累关节数目、关节疼痛程度、关节是否活动受限、关节是否肿胀以及骨摩擦音;

13、实验室检查结果:血沉、c-反应蛋白、抗链球菌溶解素o、类风湿因子、血尿酸、抗环瓜氨酸抗体以及抗核抗体;

14、诊断结果:类风湿关节炎、骨关节炎、痛风、强直性脊柱炎、系统性红斑狼疮。

15、进一步的,基于所述与疾病诊断相关的属性,筛选收集信息中患者可用信息,去除冗余信息,构成数据集包括:

16、原始数据集中存在非结构化信息,根据所述与疾病诊断相关的属性筛选可用信息,包括文本数据和数值数据。

17、进一步的,基于所述数据集,对各属性进行编码转化和缺失值处理包括:

18、对各属性进行编码转化时,对筛选出来的数据需要编码转化构成最终数据集,具体的,对于筛选的数值型属性,直接存入数据集;对于多选性文本属性,将可选值进行数值编码,然后存入数据集;

19、对编码转化后的数据集填充缺失值,对于没有数据值的属性特征,根据所述属性特征的含义,定义一个缺失的空缺值,采用均值、中位数或众数填充、插值法或随机抽样法填充。

20、进一步的,利用肘部法则、xie-beni指数以及交叉熵指标确定所述完整的数据集的最佳聚类数目:通过比较肘部法则、交叉熵和xie-beni指数三种方法得出的最佳聚类数目,如果都得出一致的结果,则将所述结果确定为最佳聚类数目;否则,采用加权的方法计算得到最佳聚类数目。

21、进一步的,对单个或多个属性进行数据增强时使用随机扰动、高斯噪声和特征组合方法,特征组合基于已有特征的组合,生成新的特征。

22、进一步的,利用fcm算法,对更新原始特征表示后的数据集进行最终聚类包括:

23、对于更新后的数据集进行聚类,根据输入数据和期望的聚类数量,确定每个聚类的中心,并将每个数据点分配给特定的聚类,

24、计算每个样本点到各聚类中心的最小距离,

25、fcm聚类方法的训练步骤如下:

26、设计聚类数目及超参数,初始化关系矩阵;

27、更新聚类中心,更新关系矩阵;

28、重复更新聚类中心和更新关系矩阵,直到两次计算得到关系矩阵的差距小于设定值或不变。

29、基于方法的技术构思,本专利技术提供一种基于cl-fcm的风湿免疫疾病数据预处理系统,包括数据抽取模块、对比模块和聚类模块;

30、数据抽取模块用于对风湿免疫疾病患者的信息筛选,抽取所述疾病诊断相关的属性,筛选收集信息中患者可用信息,包括文本数据和数值数据,去除冗余信息,构成数据集;

31、对比模块用于基于所述数据集,对各属性进行编码转化和缺失值处理,得到完整的数据集;利用肘部法则、xie-beni指数以及交叉熵多种指标确定最佳聚类数目;

32、聚类模块基于最佳聚类数目,对单个或多个属性进行数据增强,形成多视图聚类结果,计算对比损失和聚类损失,反向传播更新原始特征表示,得到更新原始特征表示后的数据集;利用fcm算法,对更新原始特征表示后的数据集进行最终聚类。

33、本专利技术还可以提供一种计算机设备,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,处理器执行计算可执行程序时能实现本专利技术所述基于cl-fcm的风湿免疫疾病数据预处理方法。

34、一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本专利技术所述的基于cl-fcm的风湿免疫疾病数据预处理方法。

35、与现有技术相比,本专利技术至少具有以下有益效果:

36、本专利技术使用编码转化、缺失值处理、模糊c均值聚类算法和多视图对比机制等技术对风湿免疫疾病数据进行预处理,与现有的风湿免疫疾病数据预处理方法相比,利用编码转化技术对多选性文本属性进行编码,得到规格化的数据集,并将对比学习与fcm算法融合,得到最终聚类数目和聚类中心,能够在面对有大量相关属性的数据集时,准确确定关键属性,提高疾病诊断效率;能够为后续推理模型减少冗余特征,减少计算量,提高模型准确率;能够帮助医生更全面地了解风湿疾病的关键特征,有助于提高诊断效率和准确率。

本文档来自技高网...

【技术保护点】

1.一种基于CL-FCM的风湿免疫疾病数据预处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于CL-FCM的风湿免疫疾病数据预处理方法,其特征在于,基于风湿免疫疾病临床数据和专家数据库确定与疾病诊断相关的属性,采用文献分析、基于专业风湿免疫科医生沟通和分析现有医疗数据,选择基本信息、家族史、专科情况、实验室检查结果和诊断结果作为与疾病诊断相关的属性,所述与疾病诊断相关的属性具体如下,

3.根据权利要求1所述的基于CL-FCM的风湿免疫疾病数据预处理方法,其特征在于,基于所述与疾病诊断相关的属性,筛选收集信息中患者可用信息,去除冗余信息,构成数据集包括:

4.根据权利要求1所述的基于CL-FCM的风湿免疫疾病数据预处理方法,其特征在于,基于所述数据集,对各属性进行编码转化和缺失值处理包括:

5.根据权利要求1所述的基于CL-FCM的风湿免疫疾病数据预处理方法,其特征在于,利用肘部法则、Xie-Beni指数以及交叉熵指标确定所述完整的数据集的最佳聚类数目:通过比较肘部法则、交叉熵和Xie-Beni指数三种方法得出的最佳聚类数目,如果都得出一致的结果,则将所述结果确定为最佳聚类数目;否则,采用加权的方法计算得到最佳聚类数目。

6.根据权利要求1所述的基于CL-FCM的风湿免疫疾病数据预处理方法,其特征在于,对单个或多个属性进行数据增强时使用随机扰动、高斯噪声和特征组合方法,特征组合基于已有特征的组合,生成新的特征。

7.根据权利要求1所述的基于CL-FCM的风湿免疫疾病数据预处理方法,其特征在于,利用FCM算法,对更新原始特征表示后的数据集进行最终聚类包括:

8.一种基于CL-FCM的风湿免疫疾病数据预处理系统,其特征在于,包括数据抽取模块、对比模块和聚类模块;

9.一种计算机设备,其特征在于,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,处理器执行计算可执行程序时能实现权利要求1~7中任一项所述基于CL-FCM的风湿免疫疾病数据预处理方法。

10.一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现如权利要求1~7中任一项所述的基于CL-FCM的风湿免疫疾病数据预处理方法。

...

【技术特征摘要】

1.一种基于cl-fcm的风湿免疫疾病数据预处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于cl-fcm的风湿免疫疾病数据预处理方法,其特征在于,基于风湿免疫疾病临床数据和专家数据库确定与疾病诊断相关的属性,采用文献分析、基于专业风湿免疫科医生沟通和分析现有医疗数据,选择基本信息、家族史、专科情况、实验室检查结果和诊断结果作为与疾病诊断相关的属性,所述与疾病诊断相关的属性具体如下,

3.根据权利要求1所述的基于cl-fcm的风湿免疫疾病数据预处理方法,其特征在于,基于所述与疾病诊断相关的属性,筛选收集信息中患者可用信息,去除冗余信息,构成数据集包括:

4.根据权利要求1所述的基于cl-fcm的风湿免疫疾病数据预处理方法,其特征在于,基于所述数据集,对各属性进行编码转化和缺失值处理包括:

5.根据权利要求1所述的基于cl-fcm的风湿免疫疾病数据预处理方法,其特征在于,利用肘部法则、xie-beni指数以及交叉熵指标确定所述完整的数据集的最佳聚类数目:通过比较肘部法则、交叉熵和xie-beni指数三种方法得出的最佳聚类数目,如果都得出一致的结...

【专利技术属性】
技术研发人员:黄昭王佳佳
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1