【技术实现步骤摘要】
本专利技术属于生物检测领域,具体的,本专利技术涉及一种分析个体两类状态的免疫差异的方法、一种分析个体两类状态的免疫差异的装置、一种辅助确定个体状态的方法和一种辅助确定个体状态的装置。
技术介绍
癌症的发生是一个渐进缓慢的过程,如能够对其做到或者辅助做到早期发现、临床有效治疗、以及预后复发监测的全面控制,可有效的降低其发生率和死亡率,将有着巨大的经济效益和社会效益。肝癌(liver cancer)是指发生于肝脏的恶性肿瘤,包括原发性肝癌和转移性肝癌,原发性肝癌是临床上最常见的恶性肿瘤之一。根据世界卫生组织最新统计,2012年全世界新发病例约78万,且半数左右的肝癌患者集中在中国,男性明显多于女性[World Cancer Report2014.World Health Organization.2014.pp.Chapter 1.1.ISBN 9283204298.]。肝癌初期症状并不明显,到了中晚期患者才有发现,但晚期患者因癌细胞扩散而治愈率较低。肝癌恶性程度极高,预后极差,居恶性肿瘤病死率的第二位,技术开发、特异性标志物的发现使能够用于或者辅助于肝癌的早期诊断 ...
【技术保护点】
一种分析个体两类状态的免疫差异的方法,其特征在于,包括,获取第一测序数据和第二测序数据,所述第一测序数据为第一类状态个体的淋巴细胞基因组的至少一部分的序列测定数据,包括多个第一读段,所述第二测序数据为第二类状态个体的淋巴细胞基因组的至少一部分的序列测定数据,包括多个第二读段,所述淋巴细胞基因组的至少一部分包括CDR3序列的至少一部分;分别对第一测序数据中的第一读段和第二测序数据中的第二读段进行拼接,获得第一拼接序列和第二拼接序列;将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对,获得第一CDR3序列和第二CDR3序列,所述多种CDR3参考序列包括V基因参考序列、D ...
【技术特征摘要】
1.一种分析个体两类状态的免疫差异的方法,其特征在于,包括,获取第一测序数据和第二测序数据,所述第一测序数据为第一类状态个体的淋巴细胞基因组的至少一部分的序列测定数据,包括多个第一读段,所述第二测序数据为第二类状态个体的淋巴细胞基因组的至少一部分的序列测定数据,包括多个第二读段,所述淋巴细胞基因组的至少一部分包括CDR3序列的至少一部分;分别对第一测序数据中的第一读段和第二测序数据中的第二读段进行拼接,获得第一拼接序列和第二拼接序列;将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对,获得第一CDR3序列和第二CDR3序列,所述多种CDR3参考序列包括V基因参考序列、D基因参考序列和J基因参考序列中的至少两种;比较第一高频CDR3序列比例和第二高频CDR3序列比例的差异,确定差异具有统计意义的高频CDR3序列比例对第一类状态和第二类状态的区分效果,所述第一高频CDR3序列比例为所述第一CDR3序列的所有种类中高频CDR3序列种类数所占的比例,所述第二高频CDR3序列比例为所述第二CDR3序列的所有种类中高频CDR3序列种类数所占的比例,所述第一高频CDR3序列为在所述第一CDR3序列中频率不小于0.05%的CDR3序列,所述第二高频CDR3序列为在所述第二CDR3序列中频率不小于0.05%的CDR3序列。2.权利要求1的方法,其特征在于,所述第一测序数据包括多对第一读段对,每对第一读段对由两个第一读段组成,所述第二测序数据包括多对第二读段对,每对所述第二读段对由两个第二读段组成,进行所述拼接依据有重叠的第一读段或第二读段,以及第一读段对或者第二读段对中一对读段对中的两个读段之间的距离。3.权利要求1的方法,其特征在于,所述多种CDR3参考序列包括V基因参考序列
\t和J基因参考序列,所述将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对,包括,将所述第一拼接序列和第二拼接序列分别与所述多种CDR3参考序列进行比对,获得第一比对结果和第二比对结果,所述第一比对结果包括能够与至少一种V基因参考序列和至少一种J基因参考序列都比对上的第一拼接序列,所述第二比对结果包括能够与至少一种V基因参考序列和至少一种J基因参考序列都比对上的第二拼接序列,基于所述第一比对结果,确定其中的第一拼接序列上的CDR3序列的起始位置,基于所述第二比对结果,确定其中的第二拼接序列上的CDR3序列的起始位置,分别将第一比对结果中的第一拼接序列上的CDR3序列起始位置之后的部分和第二比对结果中的第二拼接序列上的CDR3序列起始位置之后的部分与所述多种CDR3参考序列进行重新比对,获得第一重新比对结果和第二重新比对结果。4.权利要求3的方法,其特征在于,所述重新比对的比对条件设置为,与所述V基因参考序列的TRB基因参考序列区进行所述重新比对所允许的错配碱基数为0,与所述V基因参考序列的IGH基因参考序列区进行所述重新比对所允许的错配碱基数为2,和/或与所述J基因参考序列的TRB基因参考序列区进行所述重新比对所允许的错配碱基数为0,与所述J基因参考序列的IGH基因参考序列区进行所述重新比对所允许的错配碱基数为2。5.权利要求3的方法,其特征在于,在获得第一重新比对结果和第二重新比对结果后,还包括,分别对所述第一重新比对结果和所述第二重新比对结果进行过滤,以获得所述第一CDR3序列和所述第二CDR3序列,其中包括,分别去除第一重新比对结果和第二重新比对结果中的符合以下描述至少之一的拼接序列,其所属的CDR3序列种类的拼接序列支持数为1,未能比对上V基因参考序列或者J基因参考序列,比对上所述CDR3参考序列的假基因参考序列区,比对上V基因参考序列和J基因参考序列,且比对上二者的方向相反,无法确定其上的CDR3的起始位置,含终止密码子,不含开放阅读框。6.权利要求1的方法,其特征在于,所述第一高频CDR3序列为在所述第一CDR3序列中频率不大于0.5%的CDR3序列,所述第二高频CDR3序列为在所述第二CDR3序列中频率不大于0....
【专利技术属性】
技术研发人员:李红梅,韩颖鑫,管彦芳,吴小雷,侯永刚,张鸣,杨玲,易鑫,尹烨,
申请(专利权)人:深圳华大基因科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。