System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物信息学,具体涉及一种基于人工智能的新抗原异质数据整合方法及装置、设备、存储介质。
技术介绍
1、新抗原疫苗通过增强癌症特异性细胞毒性t细胞而成为一种有前景的癌症免疫疗法。新抗原疫苗的开发通常是通过肿瘤新抗原(neoantigen)的计算预测来启动的,其准确性极大地影响疫苗的功效。肿瘤新抗原作为免疫治疗的理想靶标,是由肿瘤细胞突变基因编码的新生抗原,主要由基因点突变、删除突变、基因融合等产生的与正常细胞表达的蛋白不一样的新的异常蛋白。这些蛋白经过酶解之后形成的多肽片段,作为抗原递呈给t细胞,可促使t细胞变为特异性地识别肿瘤新抗原的成熟活化t细胞,并使这些活化的t细胞数量增殖。
2、基于机器学习的新抗原预测计算模型的瓶颈之一在于候选新抗原的实验验证免疫原性结果的可用性,目前新抗原免疫原性验证数据相对稀缺,只有数百种新抗原已被各种独立研究验证为具有免疫原性。此外,不同研究机构和公司使用的特征存在很大程度的不一致,合并不同数据集进行新抗原预测模型训练时,会出现大量的特征缺失值。例如,由于无法获得原始测序数据,许多生物学特征(例如vaf和基因表达)的值无法获得。而对于特征值缺失的样本,通常舍弃不用,因此导致新抗原预测模型的训练数据量较少。
3、传统方式中直接产生“人工”假样本从而丰富数据集、提升数据量,但是该现有方法通过生成假样本以丰富数据集,没有考虑到样本的多个特征值之间的内部关联,因此生成的样本真实性不够,导致数据集整体可用的真实数据量较少。
技术实现思路<
...【技术保护点】
1.新抗原异质数据整合方法,其特征在于,包括:
2.如权利要求1所述的新抗原异质数据整合方法,其特征在于,标记所述第二特征向量中各个特征的真实标签,包括:
3.如权利要求1或2所述的新抗原异质数据整合方法,其特征在于,根据所述第二特征向量和所述真实标签,对生成对抗网络进行训练获得特征填充模型,包括:
4.如权利要求3所述的新抗原异质数据整合方法,其特征在于,所述生成器包括编码器、解码器和还原模块,所述编码器用于将所述第二特征向量映射至低维空间获得低维特征向量,所述解码器用于将低维空间的所述低维特征向量逐层还原回原始空间获得第三特征向量,所述还原模块用于根据所述真实标签将所述第三特征向量中正例特征对应的填充值还原为已知的特征值,获得填充特征向量。
5.如权利要求3所述的新抗原异质数据整合方法,其特征在于,所述判别器包括多个线性层和一个一维卷积模块,多个所述线性层用于对所述填充特征向量的维度进行非线性转换,所述一维卷积模块用于生成所述填充特征向量中各个特征的真实度评分,根据所述真实度评分映射得到所述填充特征向量中各个特征的预测标签。
...【技术特征摘要】
1.新抗原异质数据整合方法,其特征在于,包括:
2.如权利要求1所述的新抗原异质数据整合方法,其特征在于,标记所述第二特征向量中各个特征的真实标签,包括:
3.如权利要求1或2所述的新抗原异质数据整合方法,其特征在于,根据所述第二特征向量和所述真实标签,对生成对抗网络进行训练获得特征填充模型,包括:
4.如权利要求3所述的新抗原异质数据整合方法,其特征在于,所述生成器包括编码器、解码器和还原模块,所述编码器用于将所述第二特征向量映射至低维空间获得低维特征向量,所述解码器用于将低维空间的所述低维特征向量逐层还原回原始空间获得第三特征向量,所述还原模块用于根据所述真实标签将所述第三特征向量中正例特征对应的填充值还原为已知的特征值,获得填充特征向量。
5.如权利要求3所述的新抗原异质数据整合方法,其特征在于,所述判别器包括多个线性层和一个一维卷积模块,多个所述线性层用于对所述填充特征向量的维度进行非线性转换,所述一维卷积模块用...
【专利技术属性】
技术研发人员:万季,叶一林,沈一鸣,汪健,赵钊,潘有东,王弈,
申请(专利权)人:深圳新合睿恩生物医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。