模型训练方法、信息生成方法及装置制造方法及图纸

技术编号：40959053 阅读：5 留言：0更新日期：2024-04-18 20:36

本公开提供了一种模型训练方法、信息生成方法及装置，该模型训练方法包括：对训练数据进行数据类平衡处理，得到数据类平衡后的训练数据，训练数据包括与样本对象的健康状态相关的属性数据，每个训练数据包括与样本对象的实际健康状态对应于的样本标签；将数据类平衡后的训练数据输入初始模型，得到检测结果，其中，检测结果表征样本对象罹患脑卒中疾病的概率；根据检测结果和样本标签，得到损失值；基于损失值调整初始模型的参数，得到经训练的目标模型。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机领域，具体地涉及一种模型训练方法信息生成方法及装置。

技术介绍

1、脑卒中是严重威胁全球居民公告健康的疾病之一，是全球范围内致死、致残的重要原因。脑卒中具有发病急、病情发展迅速的特点，其会导致患者错过最佳治疗时机。因此需要一种对脑卒中风险进行预测的方法。

2、在相关技术中，常常存在数据分布不平衡的问题，这使得在进行疾病预测时会具有多分类偏向性，即对于多数类样本的预测具有较高准确率，而对于少数类样本的预测准确率较低。

技术实现思路

1、鉴于上述问题，本公开提供了模型训练方法信息生成方法及装置。

2、根据本公开的第一个方面，提供了一种模型训练方法,包括：

3、对训练数据进行数据类平衡处理，得到数据类平衡后的训练数据，上述训练数据包括与样本对象的健康状态相关的属性数据，每个训练数据包括与上述样本对象的实际健康状态对应于的样本标签；

4、将上述数据类平衡后的训练数据输入初始模型，得到检测结果，其中，上述检测结果表征上述样本对象罹患脑卒中疾病的概率；

5、根据上述检测结果和上述样本标签，得到损失值；

6、基于上述损失值调整上述初始模型的参数，得到经训练的目标模型。

7、根据本公开的实施例，上述对训练数据进行数据类平衡处理，得到数据类平衡后的训练数据之前，还包括：

8、将上述训练数据进行第一数据类平衡处理，得到第一数据类平衡后的训练数据；

9、将上述第一数据类平衡后的训练

10、根据上述第一检测结果和上述样本标签，得到第一损失值。

11、根据本公开的实施例，上述方法还包括：

12、将上述训练数据进行第二数据类平衡处理，得到第二数据类平衡后的训练数据；

13、将上述第二数据类平衡后的训练数据输入第二模型，得到第二检测结果，上述第二模型采用第二特征提取方法；

14、根据上述第二检测结果和上述样本标签，得到第二损失值。

15、根据本公开的实施例，上述方法还包括：

16、基于上述第一损失值和第一数据类平衡处理确定第一数据类平衡处理评价指标；

17、基于上述第一损失值和上述第一特征提取方法确定第一特征提取方法评价指标；

18、基于上述第二损失值和第二数据类平衡处理确定第二数据类平衡处理评价指标；

19、基于上述第二损失值和上述第二特征提取方法确定第二特征提取方法评价指标。

20、根据本公开的实施例，上述基于上述第一损失值和第一数据类平衡处理确定第一数据类平衡处理评价指标，包括：

21、采用皮尔逊相关系数求取上述第一损失值和上述第一数据类平衡处理间的相关度从而确定上述第一数据类平衡处理评价指标；

22、上述基于上述第一损失值和上述第一特征提取方法确定第一特征提取方法评价指标，包括：

23、采用皮尔逊相关系数求取上述第一损失值和上述第一特征提取方法间的相关度从而确定上述第一特征提取方法评价指标。

24、根据本公开的实施例，上述方法还包括：

25、基于上述第一数据类平衡处理评价指标和上述第二数据类平衡处理评价指标确定数据类平衡处理；

26、基于上述第一特征提取方法评价指标和上述第二特征提取方法评价指标确定特征提取方法；

27、基于上述第一损失值和上述第二损失值确定模型。

28、本公开的第二方面提供了一种信息生成方法，包括：获取与目标对象的健康相关的属性数据；将上述与目标对象的健康相关的属性数据输入目标模型，生成用于表征上述目标对象罹患脑卒中疾病的概率的检测结果信息，其中，上述目标模型是根据任一项上述的模型训练方法得到的。

29、本公开的第三方面提供了一种模型训练装置，包括：

30、数据类平衡模块，用于对训练数据进行数据类平衡处理，得到数据类平衡后的训练数据，上述训练数据包括与样本对象的健康状态相关的属性数据，每个训练数据包括与上述样本对象的实际健康状态对应于的样本标签；

31、结果检测模块，将上述数据类平衡后的训练数据输入初始模型，得到检测结果，其中，上述检测结果表征上述样本对象罹患脑卒中疾病的概率；

32、损失值计算模块，用于根据上述检测结果和上述样本标签，得到损失值；

33、参数调整模块，用于基于上述损失值调整上述初始模型的参数，得到经训练的目标模型。

34、本公开的第四方面提供了一种信息生成装置，包括：

35、获取模块，用于获取与目标对象的健康相关的属性数据；

36、检测结果生成模块，用于将上述与目标对象的健康相关的属性数据输入目标模型，生成用于表征上述目标对象罹患脑卒中疾病的概率的检测结果信息，其中，上述目标模型是根据任一项上述的模型训练方法得到的。

37、本公开的第五方面提供了一种电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得一个或多个处理器执行上述模型训练方法。

38、本公开的第六方面还提供了一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行上述模型训练方法。

39、本公开的第七方面还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述模型训练方法。

40、根据本公开的模型训练方法，通过对训练数据进行数据类平衡处理再输入初始模型进行检测，基于检测结果计算出损失值后调整初始模型的参数，获得训练好的目标模型，能够解决脑卒中数据分布不平衡的问题，获得一个检测性能良好的模型，进一步地提高了终端的处理速度。

本文档来自技高网...

【技术保护点】

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述对训练数据进行数据类平衡处理，得到数据类平衡后的训练数据之前，还包括：

3.根据权利要求2所述的模型训练方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的模型训练方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的模型训练方法，其特征在于，所述基于所述第一损失值和第一数据类平衡处理确定第一数据类平衡处理评价指标，包括：

6.根据权利要求5所述的模型训练方法，其特征在于，所述方法还包括：

7.一种信息生成方法，包括：

8.一种模型训练装置，其特征在于，所述装置包括：

9.一种信息生成装置，包括：

10.一种电子设备，包括：

【技术特征摘要】

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述对训练数据进行数据类平衡处理，得到数据类平衡后的训练数据之前，还包括：

3.根据权利要求2所述的模型训练方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的模型训练方法，其特征在于，所述方法还包括：

5.根据权利要求4...

【专利技术属性】
技术研发人员：刘超凡，郭涛，邱本胜，李浩，郝小涵，
申请(专利权)人：中国科学技术大学先进技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人