System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于域增量学习的抑郁障碍检测模型训练方法及电子设备技术_技高网

基于域增量学习的抑郁障碍检测模型训练方法及电子设备技术

技术编号:41065145 阅读:2 留言:0更新日期:2024-04-24 11:18
本发明专利技术公开了基于域增量学习的抑郁障碍检测模型训练方法及电子设备,属于数据处理技术领域。该方法包括获取训练数据集,输入当前域和前一域,进行特征提取及预测,利用JS散度以及训练数据集中的类别信息动态学习类定制的阈值,为训练数据集中的每个类使用相应类定制的阈值进行样本选择,将样本选择结果进行域内对齐,区分样本相似性,有效缩小这些领域之间的差距。这样的对齐过程鼓励从各个领域提取的特征变得更加紧凑,从而显著提高了对新数据的适应性,减轻了灾难性遗忘,有利于提高抑郁障碍检测准确性及效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,更具体的说是涉及基于域增量学习的抑郁障碍检测模型训练方法及电子设备


技术介绍

1、重度抑郁症(mdd)是一种常见的心理健康障碍,影响了数百万人的生活质量。准确、早期的抑郁症诊断对于及时干预和有效治疗至关重要。近年来,深度学习技术在医学领域中的应用取得了显著进展,为抑郁症的诊断和监测提供了新的可能性。尽管目前的深度神经网络在mdd检测任务中表现出有希望的性能,但这些模型需要同时访问所有可用数据。在现实世界中,不同的机构通常在不同时间收集临床数据,使得在初始训练阶段访问所有数据变得不可用。因此,现阶段转向了域增量学习(dil)来处理连续数据流,该方法旨在使模型适应新数据而不影响其在历史任务上的性能。尽管对人类来说这可能似乎很轻松,但经过良好训练的模型通常会遭受“灾难性遗忘”的困扰,即当它们获取新信息时会忘记先前学到的知识。现有的主流dil方法假设在模型训练过程中可以轻松访问旧数据,这要么保留了历史数据的一小部分,要么通过统计属性使用生成回放技术。然而,实际情况是“旧数据的可访问性可能有限”,原因包括隐私问题(如生物识别数据集)或意外数据丢失(如数据损坏),因此通常只能访问经过良好训练的模型。这使得使用原始训练数据进行参考或微调可能变得不切实际。

2、域增量学习(domain incremental learning,dil)是一种机器学习领域的方法,用于处理在不断变化的数据领域中持续学习的任务。在抑郁障碍检测中,域增量学习变得尤为重要,因为抑郁障碍数据通常以连续数据流的形式出现,这些数据流可能来自不同的时间点、来源或环境,因此需要一种方法来适应这种不断变化的数据。当模型在学习新的数据领域时,往往会忘记先前学到的信息。这是因为传统的机器学习模型在接收新数据时,会完全调整自身以适应新数据,导致遗忘了旧数据的知识。为了缓解灾难性遗忘的问题,它首先根据概率分布差异为每个类别学习一个阈值,并基于此选择确定与前一个域相似的样本以及不相似的样本。这些相似的样本用于保留历史知识,进一步的迫使不相似的样本靠近样本,以此缓解这些样本之间的差距。为了应对这些挑战,域增量学习方法在抑郁障碍检测中变得至关重要。本专利技术允许模型在学习新数据时保留先前学到的信息,从而减轻了灾难性遗忘问题。此外,一些创新性的方法,如使用动态调整的阈值和域内对齐,有助于更好地处理类别不平衡和保护隐私。

3、为了弥合实际需求与域增量学习框架之间的差距,可以利用无数据领域增量学习(df-dil)。主流df-dil方法通常利用生成模型合成样本,以在保持对先前任务的性能的同时适应新任务。然而,在实际的设置中,通常只有一个经过良好训练的先前模型的可用性,因此在实际应用中,无法利用历史信息。在不依赖历史信息的情况下进行适应和增量学习变得至关重要。另一个值得关注的问题是“类别不平衡”,在重度抑郁症mdd数据中常常会出现这个问题。事实上,合成数据继承了历史数据的不平衡特性。合成数据可能具有类似于以前数据的类别分布,其中少数类的样本有限,而多数类的样本丰富。这种循环效应进一步加剧了类别不平衡问题,使这些方法在重度抑郁症mdd检测任务中性能降低。

4、因此,如何提供一种基于域增量学习的抑郁障碍检测模型训练方法及电子设备是本领域技术人员亟需解决的问题。


技术实现思路

1、有鉴于此,本专利技术提供了一种基于域增量学习的抑郁障碍检测模型训练方法及电子设备,用于解决上述现有技术中存在的问题。

2、为了实现上述目的,本专利技术提供如下技术方案:

3、一方面,本专利技术提供了一种基于域增量学习的抑郁障碍检测模型训练方法,包括以下步骤:

4、获取训练数据集;

5、将获取的训练数据集进行训练,得到特征提取网络模型;

6、通过所述特征提取网络模型得到训练数据集中不同类别样本上的标签预测结果;

7、利用js散度比较预测结果之间的差异;

8、利用js散度以及训练数据集中的类别信息动态学习类定制的阈值;

9、为训练数据集中的每个类使用相应类定制的阈值进行样本选择;

10、将样本选择结果进行域内对齐,区分样本相似性;

11、根据样本相似性得到域对齐损失函数,并通过所述域对齐损失函数进行域增量学习,从而得到训练好的抑郁障碍检测模型。

12、可选的,所述训练数据集包括从社交平台收集的抑郁症用户信息和非抑郁症用户信息。

13、可选的,所述将获取的训练数据集进行训练,得到特征提取网络模型为:

14、;

15、其中,和是通过第n个域训练的特征提取网络和分类模型;表示提取的特征;表示标签预测;表示标准的交叉熵损失。

16、可选的,通过所述特征提取网络模型得到训练数据集中不同类别样本上的标签预测结果,包括:

17、将真实标签预测分解为重度抑郁障碍类和健康类,表达式为:

18、;

19、其中,表示为重度抑郁障碍类;表示为健康类;

20、利用特征提取网络模型重新训练数据集中提取的特征,表达式为:

21、;

22、其中,表示通过将特征提取器应用到而得到的嵌入,是分类器在不同类别样本上的标签预测结果。

23、可选的,所述利用js散度比较预测结果之间的差异,包括:

24、;

25、其中,表示kl散度,和分别表示重度抑郁障碍类样本和健康类样本之间的预测差异。

26、可选的,所述利用js散度以及训练数据集中的类别信息动态学习类定制的阈值,包括:

27、;

28、其中,和表示均值和标准差,表示调整类定制阈值的超参数。

29、可选的,所述为训练数据集中的每个类使用相应类定制的阈值进行样本选择,包括:

30、;

31、其中,表示域相似重度抑郁障碍类样本集、表示域不相似重度抑郁障碍类样本集、表示域相似健康类样本集、表示域不相似健康类样本集,表示第个域中被预测成为抑郁障碍的样本,表示第个域中被预测成为健康被试的样本,表示其中第个抑郁障碍样本,表示第个健康被试样本。

32、可选的,所述将样本选择结果进行域内对齐,区分样本相似性,包括:

33、;

34、其中,表示为与前一个域相似的样本,表示为与前一个域不相似的样本。

35、可选的,所述根据样本相似性得到域对齐损失函数为:

36、;

37、其中,表示最大均值差异损失,表示为相似样本和不相似样本之间的距离。

38、mmd:maximum mean discrepancy最大平均差异。

39、另一方面,本专利技术提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现基于域增量学习的抑郁障碍检测模型训练方法的步骤。

40、经由上述的技术方案可本文档来自技高网...

【技术保护点】

1.一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述训练数据集包括从社交平台收集的抑郁症用户信息和非抑郁症用户信息。

3.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述将获取的训练数据集进行训练,得到特征提取网络模型为:

4.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,通过所述特征提取网络模型得到训练数据集中不同类别样本上的标签预测结果,包括:

5.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述利用JS散度比较预测结果之间的差异,包括:

6.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述利用JS散度以及训练数据集中的类别信息动态学习类定制的阈值,包括:

7.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述为训练数据集中的每个类使用相应类定制的阈值进行样本选择,包括:

8.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述将样本选择结果进行域内对齐,区分样本相似性,包括:

9.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述根据样本相似性得到域对齐损失函数为:

10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9任一所述的基于域增量学习的抑郁障碍检测模型训练方法的步骤。

...

【技术特征摘要】

1.一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述训练数据集包括从社交平台收集的抑郁症用户信息和非抑郁症用户信息。

3.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述将获取的训练数据集进行训练,得到特征提取网络模型为:

4.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,通过所述特征提取网络模型得到训练数据集中不同类别样本上的标签预测结果,包括:

5.根据权利要求1所述的一种基于域增量学习的抑郁障碍检测模型训练方法,其特征在于,所述利用js散度比较预测结果之间的差异,包括:

6.根据权利要求1所述的一种基于域增量学习的抑郁障...

【专利技术属性】
技术研发人员:郭艳蓉陈涛郝世杰洪日昌
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1