基于深度学习的临床评估系统技术方案

技术编号：40610644 阅读：5 留言：0更新日期：2024-03-12 22:18

本发明专利技术提出一种基于深度学习的临床评估系统，基于计算机系统，包括：样本生成模块：把每个患者的血液测试样本按时间顺序从小到大排列后，根据患者提供的多个血液测试样本以及每个样本对应的m个血清学指标构建获得用于评估的数据集；以及至少一个以下评估模型：疾病严重性预测模型，包括：长短期记忆网络、批量归一化层、拉平层、随机失活层和全连接层；临床结局预测模型，包括：TA块、长短期记忆网络、批量归一化、全连接层、拉平层、随机失活层和全连接层；样本抗体水平预测模型，包括：长短期记忆网络、随机失活层、全连接层、随机失活层和全连接层。以实现很好地捕捉到血清随时间变化的信息。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习、临床医学和机器学习，尤其是一种基于深度学习的临床评估系统。

技术介绍

1、

2、以往研究有一部分关注到了血清学指标的随时间发生变化的规律。然而，现有的研究在疾病严重性预测、临床结局预测和抗体水平预测的模型上并没有充分的考虑患者血清学指标随时间变化的信息的重要性。特别是抗体水平预测的实验中，血清学指标的时变信息十分重要，因为有研究表明igg抗体水平随时间产生周期性变化，忽略或者没有充分考虑时间信息会导致模型鲁棒性不强。

技术实现思路

1、为了解决现有临床评估系统和方案时间信息缺失问题，本专利技术首先提出了新的数据预处理方法以使数据具有时间信息。并且还在在临床结果预测中提出“时间注意力块”(ta)块来加强对后期血清学样本的重心，并且在抗体水平预测中提出改进后的自注意力机制用于抗体水平预测(即自相似注意力层)。

2、本专利技术对疾病严重性、临床结局和抗体水平检验这三个任务各自设置相应的模型使模型对患者样本之间的时间信息的利用达到最大化。本专利技术的技术方案如下：

3、在方案构建之前，首先用部分集成学习模型(如catboost，lightgbm等)或回归模型对重要的血清学指标进行特性选择。选取对预测目标(预测目标的解释：抗体水平预测任务里面的预测目标就是“抗体水平”)影响最大的m个血清学指标用于模型的训练。

4、之后是用于样本数据生成和预处理的样本生成模块，包括两个主要技术细节：

5、1、每个患者在住院期间

6、2、对其样本数小于n的他患者进行填充，即样本数少于n的患者在开头序列处用0填充。之所以在开头填而不是结尾是为了因为ta块重后期指标，如果在结尾序列填0则效果会影响后续模型使用ta块的功能。这样就可以使每位患者得到一个形状为(n，m)的矩阵。然后对三个任务设置不同的模型用于相应的预测。

7、本专利技术提供的系统分别对三个任务建立相应的模型以实现预测和评估：

8、对于疾病严重性的预测的模型，将数据输入长短期记忆网络再输入批量归一化层、拉平层、随机失活层和全连接层。而对于血清学数据多，其中加入随机失活层可以更好的加强模型的泛化能力取得更好的预测效果。

9、对于临床结局的预测，则将数据输入ta块、长短期记忆网络、批量归一化、全连接层、拉平层、随机失活层和全连接层。其中ta块对各个序列赋予相应的权重，在本任务上可以使模型注重于后期较为重要的样本。

10、对于样本的抗体水平预测任务，预测模型将数据输入自相似注意力层、长短期记忆网络、随机失活层、全连接层、随机失活层和全连接层。其中，自相似注意力层是优选的组件以适应输入序列的多样性。

11、本专利技术利用深度学习的注意力机制以及相关模型结合样本时间信息优化对疾病严重性、临床结果和抗体水平预测，对临床研究有显著的指导价值。

12、其具体采用以下技术方案：

13、一种基于深度学习的临床评估系统，基于计算机系统，其特征在于，包括：

14、样本生成模块：把每个患者的血液测试样本按时间顺序从小到大排列，根据患者提供的多个血液测试样本以及每个样本筛选后的的m个血清学指标构建获得用于评估的数据集；

15、以及至少一个以下评估模型：

16、疾病严重性预测模型，包括：长短期记忆网络、批量归一化层、拉平层、随机失活层和全连接层；

17、临床结局预测模型，包括：ta块、长短期记忆网络、批量归一化、全连接层、拉平层、随机失活层和全连接层；

18、样本抗体水平预测模型，包括：长短期记忆网络、随机失活层、全连接层、随机失活层和全连接层。

19、进一步地，m个血清学指标通过血清学指标筛选模块采用集成学习模型或回归模型筛选获得。这里需要注意的是，患者每个样本理论上的血清学指标肯定是远大于m的。本专利技术采用回归(或者集成学习)筛选对应任务影响最大的m个血清学指标，一般来说，三个任务筛选的血清学指标不同，也就是说一般情况下，对于本专利技术提供的三个预测模型，以下所提及的m实际上不同，也对应不同的血清学指标。比如疾病严重性预测(这里用lasso举例)，我们用所有样本所有血清作为x，严重程度作为标签y。进行训练。然后返回出各个血清学指标对应的参数。取最大的m个参数对应的血清学指标。

20、在所述样本生成模块中，选取样本数最多的患者的样本数量作为基准值n，然后对样本数少于n的患者在开头序列处用0填充，使每位患者得到一个(n，m)的矩阵，作为用于评估的数据集。

21、进一步地，所述样本的抗体水平预测模型的长短期记忆网络之前还设置有自相似注意力层；所述自相似注意力层中每个序列的q和k就是输入序列本身，并不是由输入序列乘与可学习的权重参数得到；qtk的值不仅代表注意力权重，还代表两个序列之间的余弦相似度；qtk值越大则两个序列向量的夹角越接近0，相似度就越高且两个序列的时间间隔小。

22、进一步地，所述疾病严重性预测模型输入的数据张量的形状为[x,n,m]，其中x为batch_size，对应训练一次输入的患者的人数；把数据输入层数为一层，激活函数为relu的长短期记忆网络，再输入批量归一化层、拉平层、丢弃概率设置为0.5的随机失活层和神经元个数为1，用sigmoid作为激活函数把数值放缩到0-1的全连接层；损失函数采用交叉熵损失函数；以0.5作为划分阈值，对应的数值0是轻度，1是重度。

23、进一步地，所述临床结局预测模型输入的数据张量的形状为[x,n,m]，其中x为batch_size，对应训练一次输入的患者的人数；把数据输入ta块、层数为一层，激活函数为relu的长短期记忆网络、批量归一化层、全连接层、拉平层、丢弃概率设置为0.5的随机失活层和神经元个数为1，用sigmoid作为激活函数把数值放缩到0-1的全连接层；损失函数采用交叉熵损失函数；以0.5作为划分阈值，对应的数值0是出院，1是死亡。

24、进一步地，所述ta块对各个序列赋予相应的权重，使模型注重于后期样本。

25、进一步地，所述样本抗体水平预测模型对于抗体水平的预测，输入的数据张量的形状为[x,n,m]，其中x为batch_size，对应训练一次输入的患者的人数；把数据输入自相似注意力层、层数为一层，激活函数为relu的长短期记忆网络、丢弃概率设置为0.5的随机失活层、神经元个数为3的全连接层、丢弃概率设置为0.5的随机失活层和神经元个数为1的全连接层；损失函数采用mae。

26、相较于现有技术，本专利技术及其优选方案具有以下设计点或有益效果：

27、(1)通过预处理的模块对患者的所有采用时间顺序排列输入长短期记忆网络，以很好地捕捉到血清随时间变化的信息。

28、(2)本本文档来自技高网...

【技术保护点】

1.一种基于深度学习的临床评估系统，基于计算机系统，其特征在于，包括：

2.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：m个血清学指标通过血清学指标筛选模块采用集成学习模型或回归模型筛选获得。

3.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：在所述样本生成模块中，选取样本数最多的患者的样本数量作为基准值n，然后对样本数少于n的患者在开头序列处用0填充，使每位患者得到一个(n，m)的矩阵，作为用于评估的数据集。

4.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：所述样本的抗体水平预测模型的长短期记忆网络之前还设置有自相似注意力层；所述自相似注意力层中每个序列的q和k就是输入序列本身，并不是由输入序列乘与可学习的权重参数得到；qTk的值不仅代表注意力权重，还代表两个序列之间的余弦相似度；qTk值越大则两个序列向量的夹角越接近0，相似度就越高且两个序列的时间间隔小。

5.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：所述疾病严重性预测模型输入的数据张量的形状为[x,n,m]，其中

6.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：所述临床结局预测模型输入的数据张量的形状为[x,n,m]，其中x为batch_size，对应训练一次输入的患者的人数；把数据输入TA块、层数为一层，激活函数为Relu的长短期记忆网络、批量归一化层、全连接层、拉平层、丢弃概率设置为0.5的随机失活层和神经元个数为1，用sigmoid作为激活函数把数值放缩到0-1的全连接层；损失函数采用交叉熵损失函数；以0.5作为划分阈值，对应的数值0是出院，1是死亡。

7.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：所述TA块对各个序列赋予相应的权重，使模型注重于后期样本。

8.根据权利要求4所述的基于深度学习的临床评估系统，其特征在于：所述样本抗体水平预测模型对于抗体水平的预测，输入的数据张量的形状为[x,n,m]，其中x为batch_size，对应训练一次输入的患者的人数；把数据输入自相似注意力层、层数为一层，激活函数为Relu的长短期记忆网络、丢弃概率设置为0.5的随机失活层、神经元个数为3的全连接层、丢弃概率设置为0.5的随机失活层和神经元个数为1的全连接层；损失函数采用MAE。

...

【技术特征摘要】

1.一种基于深度学习的临床评估系统，基于计算机系统，其特征在于，包括：

2.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：m个血清学指标通过血清学指标筛选模块采用集成学习模型或回归模型筛选获得。

4.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：所述样本的抗体水平预测模型的长短期记忆网络之前还设置有自相似注意力层；所述自相似注意力层中每个序列的q和k就是输入序列本身，并不是由输入序列乘与可学习的权重参数得到；qtk的值不仅代表注意力权重，还代表两个序列之间的余弦相似度；qtk值越大则两个序列向量的夹角越接近0，相似度就越高且两个序列的时间间隔小。

5.根据权利要求1所述的基于深度学习的临床评估系统，其特征在于：所述疾病严重性预测模型输入的数据张量的形状为[x,n,m]，其中x为batch_size，对应训练一次输入的患者的人数；把数据输入层数为一层，激活函数为relu的长短期记忆网络，再输入批量归一化层、拉平层、丢弃概率设置为0.5的随机失活层和神经元个数为1，用...

【专利技术属性】
技术研发人员：蔡加欣，朱圣俊，
申请(专利权)人：厦门理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人