一种基于残差网络结合通道注意力机制的体细胞突变识别方法及系统技术方案

技术编号:45509969 阅读:17 留言:0更新日期:2025-06-13 17:16
本发明专利技术公开了一种基于残差网络结合通道注意力机制的体细胞突变识别方法及系统,包括:扫描肿瘤样本及配对正常样本的序列比对结果,并构建多通道特征矩阵表示;构造结合残差网络(ResNeXt)与通道注意力机制(SE模块)的体细胞突变识别模型,利用测试集进行验证和微调,进而得到性能优异且适合资源受限环境部署的体细胞突变识别模型。本发明专利技术提出了一种新的混合神经网络,网络充分利用了肿瘤样本及配对正常样本的序列比对结果信息,可以更有效的提取并学习体细胞突变信息,提高了突变识别精确度。

【技术实现步骤摘要】

本专利技术属于生命科学领域,具体涉及一种基于残差网络结合通道注意力机制的体细胞突变识别方法及系统


技术介绍

1、体细胞突变检测是研究基因组突变和基因组功能的重要手段。有研究显示每个个体中10%~50%的snv是新的突变。大多数癌症相关的体细胞突变或其他非癌性体细胞突变无法区分。例如,体细胞突变在肿瘤基因组中的比例通常较低,使得在检测过程中难以准确辨认出真正的体细胞突变。并且,体细胞突变的数量相对较少,在肿瘤基因组突变中所占比例一般不超过1%。而体细胞突变是癌症发生、发展和治疗的关键特征,由于受肿瘤-正常交叉污染、肿瘤异质性、测序伪影和覆盖率等因素影响,检测snv时需要考虑多个方面,例如肿瘤异质性不仅存在肿瘤内部还存在于肿瘤间,测序深度不足时,一些有突变意义的阳性突变可能被过滤或覆盖,肿瘤细胞可能发生的拷贝数突变、indel等基因突变,以及pcr扩增等测序方法,这些都会对体细胞突变检测造成影响。

2、综上所述,现有技术问题:

3、1.在传统基于机器学习的突变识别方法中,过多的数据预处理流程对容易导致特征提取出现偏差,且提取的特征数量本文档来自技高网...

【技术保护点】

1.一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于:所述特征矩阵包括26个通道,每个通道的矩阵维度为5×32,其中5行分别表示A、C、G、T四种DNA碱基及间隙字符‘-’,32列对应于比对中的具体列位置,从肿瘤样本与正常样本的序列比对结果文件中提取多序列比对信息,计算每列中字符A、C、G、T和‘-’的频率,将其存储在对应通道中。

3.根据权利要求2所述一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于:所述特征矩阵包括肿瘤样...

【技术特征摘要】

1.一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于:所述特征矩阵包括26个通道,每个通道的矩阵维度为5×32,其中5行分别表示a、c、g、t四种dna碱基及间隙字符‘-’,32列对应于比对中的具体列位置,从肿瘤样本与正常样本的序列比对结果文件中提取多序列比对信息,计算每列中字符a、c、g、t和‘-’的频率,将其存储在对应通道中。

3.根据权利要求2所述一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于:所述特征矩阵包括肿瘤样本矩阵和正常样本矩阵,组合后的26通道矩阵将作为模型的输入。

4.根据权利要求1所述一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于:所述残差模块的输出表示为:其中,x是输入特征张量,形状为(cin,h,w),h表示特征张量高度,w表示特征张量在宽度,表示通过卷积层提取的特征映射,{wi}表示每一层的卷积权重,y表示输出特征张量,加法x+f(x)表示残差连接;

5.根据权利要求4所述一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于:在通道注意力模块中引入将全局空间信息挤压到通道描述符中,即:

6.根据权利要求5所述一种基于残差网络结合通道注意力机制的体细胞突变识别方法,其特征在于:还使用一个简单的sigmoid激活的门控机制来完全捕获通道依赖性,该门控机制表示为:...

【专利技术属性】
技术研发人员:浦丹陆博文舒坤贤柯泊严黄诗越
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1