当前位置: 首页 > 专利查询>鲁东大学专利>正文

一种基于多实例学习的人体免疫状态预测方法技术

技术编号:39508444 阅读:5 留言:0更新日期:2023-11-25 18:43
本发明专利技术属于生物信息学领域,涉及一种基于多实例学习的人体免疫状态预测方法

【技术实现步骤摘要】
一种基于多实例学习的人体免疫状态预测方法


[0001]本专利技术属于生物信息学领域,涉及一种基于多实例学习的人体免疫状态预测方法


技术介绍

[0002]T
细胞是人体免疫系统的重要组成部分之一,它的功能是识别抗原并与抗原相结合,
T
细胞受体则在该过程中扮演了重要角色,因此
T
细胞受体可以直接反映人体的免疫状态

[0003] 大多数基于
T
细胞受体序列的人体免疫状态预测方法都只关注人体的某一条
T
细胞受体序列,而忽略它们之间的联系

基于多实例学习的检测方法则可以充分考虑序列之间的相关性,但现有方法大多直接移植于传统多实例学习
, 而传统多实例学习的包分类方法过于简单,无法对人体免疫状态进行准确的预测


技术实现思路

[0004]为了克服上述困难,本专利技术提出了一种基于多实例学习的人体免疫状态预测方法

本方法将多个人体内的
T
细胞受体序列视为实例,将人体免疫状态视为包,充分考虑
T
细胞受体序列与人体免疫状态之间的关系,在包分类模块中使用卷积神经网络避免了传统多实例学习无法充分考虑实例与包之间关系的问题

[0005]一种基于多实例学习的人体免疫状态预测方法,包括实例评分模块的构建

包分类模块的构建

模型训练三个步骤,其具体步骤如下:步骤
>1、
使用三个并行的卷积神经网络模块和一个全连接层组成一个实例评分模块,用于获得每条
T
细胞受体序列的评分;步骤
2、
使用三个并行的卷积神经网络模块和一个全连接层组成一个包分类模块;步骤
3、
使用人体的免疫状态作为标签,人体的
T
细胞受体序列作为输入对整个模型进行训练

[0006]一种基于多实例学习的人体免疫状态预测方法,步骤1实现过程如下:在构建实例评分模块时,使用
pytorch 的
nn.Conv2d、nn.Relu、nn.BatchNormalization、nn.Dropout
构建三个具有不同卷积核大小的卷积模块,这三个卷积模块采用并行结构,使用
nn.Linear
函数构建一个全连接层

[0007]一种基于多实例学习的人体免疫状态预测方法,步骤2实现过程如下:在构建包分类模块时,使用
pytorch 的
nn.Conv1d、nn.Relu、nn.BatchNormalization、nn.Dropout
构建三个具有不同卷积核大小的卷积模块,这三个卷积模块采用并行结构,使用
nn.Linear
函数构建一个全连接层

[0008]一种基于多实例学习的人体免疫状态预测方法,步骤3实现过程如下:将步骤1和步骤2构建的模块组成完整模型,以
T
细胞受体序列作为输入,在输入到实例评分模块前,将数据的包数量和实例数量进行合并,合并后的维度作为批处理量输入
到模型中

在实例评分模块得到了每条实例的评分后,把批处理量重新拆分为包数量和实例数量,并以包数量作为批处理量输入到包分类模块中,最终得到模型对各个包的预测结果

附图说明
[0009]图1是一种基于多实例学习的人体免疫状态预测方法流程图

[0010]图2是实例评分模块流程图

[0011]图3是包分类模块流程图

具体实施方式
[0012]以下结合附图和实例对本专利技术进行详细说明

[0013]本专利技术提出一种基于多实例学习的人体免疫状态预测方法,特别地,用于人体免疫状态预测

[0014]一种基于多实例学习的人体免疫状态预测方法,图1是一种基于多实例学习的人体免疫状态预测方法流程图,包括实例评分模块的构建

包分类模块的构建

模型训练三个步骤,其具体实施方式如下:步骤1:实例评分模块的构建,图2为实例评分模块流程图,包括以下内容:使用
pytorch 的
nn.Conv2d、nn.Relu、nn.BatchNormalization、nn.Dropout
构建三个并行的卷积模块,这三个卷积模块都是由卷积神经网络

激活函数

归一化函数

随机失活函数组成

卷积模块的卷积核大小分别为3×
50
,5×
50
,7×
50。
卷积模块的输入通道数都为1,输出通道数都为
3。
使用
nn.Linear
构建一个全连接层,大小为
153
×1,该全连接层用于将卷积模块提取到的实例特征转化为实例评分

[0015]步骤2:包分类模块的构建,图3为包分类模块流程图,包括以下内容:使用
pytorch 的
nn.Conv1d、nn.Relu、nn.BatchNormalization、nn.Dropout
构建三个并行的卷积模块,这三个卷积模块都是由卷积神经网络

激活函数

归一化函数

随机失活函数组成

卷积模块的卷积核大小分别为3,5,
7。
卷积模块的输入通道数都为1,输出通道数都为
1。
使用
nn.Linear
构建一个全连接层,大小为
288
×
人体免疫状态的类别数,该全连接层用于将卷积模块提取到的包特征转化为预测结果

[0016]步骤3:模型训练,包括以下内容:将步骤1和步骤2构建的模块组成完整模型,以
50
维的词向量替换
T
细胞受体序列中的氨基酸后作为输入,数据的维度大小为(包的数量,
100

21

50
),其中包的数量为人体的数量,
100
表示每个包中含有
100

T
细胞受体序列,
21
表示
T
细胞受体序列的长度,
50
表示每个氨基酸词向量的维度大小

在输入到实例评分模块前,将数据的包数量和实例数量进行合并,合并后输入数据的维度大小变为(包的数量
×
100
,1,
21

50
),其中包的数量
×
100
是所有训练数据中
T
细胞受体序列的数量,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于多实例学习的人体免疫状态预测方法,其特征在于,将多个人体内的
T
细胞受体序列视为实例,将人体免疫状态视为包,充分考虑
T
细胞受体序列与人体免疫状态之间的关系,可以对人体免疫状态进行直接预测,在包分类模块中使用卷积神经网络避免了传统多实例学习无法充分考虑实例与包之间关系的问题,该方法包括实例评分模块的构建

包分类模块的构建

模型训练三个步骤,其具体步骤如下:步骤
1、
使用三个并行的卷积神经网络模块和一个全连接层组成一个实例评分模块,用于获得每条
T
细胞受体序列的评分;步骤
2、
使用三个并行的卷积神经网络模块和一个全连接层组成一个包分类模块;步骤
3、
使用人体的免疫状态作为标签,人体的
T
细胞受体序列作为输入对整个模型进行训练
。2.
根据权利要求1所述的一种基于多实例学习的人体免疫状态预测方法,其特征在于,通过并行的卷积神经网络模块来提取序列在不同维度的特征,可以对序列做出更为准确的评分,实例评分模块的构建的实现过程如下:在构建实例评分模块时,使用
pytorch 的
nn.Conv2d、nn.Relu、nn.BatchNormalization、nn.Dropout

【专利技术属性】
技术研发人员:刘峻江周树森柳婵娟臧睦君刘通王庆军
申请(专利权)人:鲁东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1