System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于病原宏基因二代测序的耐药基因检测方法技术_技高网

一种基于病原宏基因二代测序的耐药基因检测方法技术

技术编号:40626966 阅读:2 留言:0更新日期:2024-03-13 21:14
本发明专利技术属于宏基因组测序分析技术领域,提供了一种基于病原宏基因二代测序的耐药基因检测方法。本发明专利技术不依赖于细菌的培养,与传统方法相比具有更高的敏感性和特异性;并且与现有病原宏基因组的耐药基因分析相比,本发明专利技术提供了一个更全面且无冗余的耐药基因比对数据库,在保证耐药基因全面准确的基础,又不会增加分析资源与成本的消耗;另外,在去除人源宿主序列中,本发明专利技术新增了专门针对中国人种的炎黄一号基因组序列和人类基因组序列无间隙版本,这使得人源序列去除的更加彻底,减少了人源序列对耐药基因分析的影响。除此之外,本发明专利技术还提供了一个耐药基因注释数据库,增加了耐药基因结果可读性,有助于实现临床细菌耐药情况的快速诊断。

【技术实现步骤摘要】

本专利技术涉及宏基因组测序分析,具体涉及一种基于病原宏基因二代测序的耐药基因检测方法


技术介绍

1、近些年来,随着感染性疾病的增多,第三代和第四代头孢菌素、碳青霉烯类以及氟喹诺酮类等超广谱药物被广泛使用,这导致病原微生物(一般指细菌)的耐药情况变得日益加剧,严重影响了疾病的治疗效果。因此,在疾病治疗中对细菌耐药基因进行检测在临床诊断中具有重要意义。

2、目前,传统的细菌耐药性检测主要依赖于形态学、培养等方法,需要先从标本中培养分离到病原菌,然后测定细菌的药物敏感性,测定的方法主要包括纸片扩散法,k-b法,稀释法等。其中,稀释法是临床检测和实验室研究中最为常用的细菌耐药性检测方法,堪称细菌耐药性检测的金标准。但这种方法存在许多局限性,比如需要耗费大量时间,测定过程复杂,无法培养一些难以培养的细菌,并且不能同时检测多个细菌种类。

3、目前,常规的病原宏基因耐药基因检测利用了高通量测序技术,不依赖于细菌的培养,与上述传统方法相比虽然具有更高的敏感性和特异性,但仍存在着一些问题,诸如:(1)目前基于宏基因二代测序的耐药基因检测方法大多是针对单一数据库(比如card,resfinder等),单一耐药基因数据库不够准确、全面和完整,而且目前又缺乏准确完整的耐药基因数据库,因此要想获得准确全面的耐药基因结果往往需要投入大量的精力和成本;(2)人源序列数据库中常用的人类参考基因组版本为hg19,hg38等,其主要来自高加索人种,对于中国人群来说,不具有广泛适用性;除此之外,hg19、hg38等版本的人类参考基因组,只针对了92%的人类基因组进行了排序,剩下8%在图谱中依旧是缺失状态;(3)在病原宏基因耐药基因检测中,由于测序错误、低质量序列存在以及read长度太短,这使得耐药基因检测结果经常会出现假阳性或者假阴性情况;(4)部分宏基因组分析技术尚不能将物种鉴定与耐药分析进行有机地整合,无法提供更为全面的信息分析结果。上述问题进一步限制了宏基因二代测序对耐药基因检测分析的发展,这使得其难以为临床提供准确且有意义的耐药基因信息。


技术实现思路

1、本专利技术的目的是针对现有技术的不足,提供了一种基于病原宏基因二代测序的耐药基因检测方法。本专利技术联合card数据库、resfinder数据库、argannot数据库以及ncbibetalactamase数据库,通过过滤、筛选,构建出一套全面而完整的耐药基因数据库体系;后续通过将测序数据与所构建耐药数据库中的耐药基因进行比对和分析,从而确定样品中是否存在耐药基因;可以帮助医生和临床实验室确定细菌等微生物是否携带耐药基因,并为临床治疗提供指导。

2、本专利技术采用的技术方案具体包括如下步骤:

3、一种基于宏基因组二代测序的细菌耐药基因检测方法,包括以下步骤:

4、步骤s1:联合card、resfinder、argannot以及ncbibetalactamase四个耐药基因数据库,过滤、筛选、重建细菌耐药基因数据库,具体包括细菌耐药基因比对数据库和细菌耐药基因注释数据库;

5、步骤s2:对病原宏基因组样本进行测序,并对测序数据样本进行标签识别;待测序结束后对数据样本进行序列拆分,即得到病原宏基因组原始测序数据;

6、步骤s3:对病原宏基因组原始测序数据进行质量控制;

7、步骤s4:构建人源序列数据库,将质控后的数据与人源序列数据库进行比对,并过滤人源宿主序列,即得非人源序列;

8、步骤s5:将非人源序列组装成contigs;

9、步骤s6:组装之后的contigs序列往耐药基因比对数据库上进行比对;

10、步骤s7:筛选耐药基因;

11、步骤s8:对耐药基因耐药机制、所属耐药类别和物种来源的信息进行注释。

12、进一步,步骤s1中的耐药基因比对数据库的构建方法包括如下步骤:

13、(1)下载耐药基因参考序列:从card、resfinder、argannot以及ncbibetalactamase四个耐药基因数据库下载耐药基因列表及其对应序列;

14、(2)统一命名耐药基因:序列下载完成后,对耐药基因的命名实现统一;具体涉及字母大小写、有无括号、有无bla前缀等;

15、(3)过滤处理耐药基因序列:过滤掉命名模糊不清,耐药基因长度小于100bp的序列,去除低复杂度序列以及污染序列;

16、(4)相同耐药基因的筛选:a.一个基因在两个及以上耐药数据库中同时出现且序列相同,保留其一;b.一个基因在两个及以上耐药数据库中同时出现但序列不同,根据大多数原则,保留出现次数在两次及以上的序列;c.一个基因在多个数据库中同时出现但是序列彼此之间均不相同,根据数据库优先级排序保留优先级更高的数据库中的序列,数据库优先级为card>resfinder>argannot>ncbibetalactamase。

17、本专利技术采用上述方法构建的耐药基因比对数据库,既包含了全面完整的细菌的耐药基因序列,并去除冗余重复及可信度较低的基因序列,确保耐药基因序列的完整性和准确性,且减少序列冗余,提高了分析比对速度,又去除了污染以及重复序列带来的影响,同时又可以一次分析多种菌所对应的耐药基因,完全避免了传统方法带来的时间成本高,通量低,培养难度大的缺点。

18、进一步,步骤s1中的细菌耐药基因注释数据库的构建方法包括如下步骤:

19、(1)从card、resfinder、argannot以及ncbibetalactamase四个耐药基因数据库中下载注释信息;从ncbi数据库中下载dna accession所对应的物种信息;

20、(2)不同数据库之间对同一耐药基因的注释信息有可能不同,按照优先级card>resfinder>argannot>ncbibetalactamase的顺序进行保留;

21、(3)对注释信息进行汇总和整理,去除掉不同数据库之间的冗余信息,过滤掉低质量的记录信息。

22、本专利技术是基于二代高通量测序数据的耐药基因分析方法,由于目前的测序仪通量都比较大,病原宏基因组单个样本大小一般在20m~50m之间,所以在实际测序过程都是多个样本混合在一起同时测序,每个样本用独特的标签序列(barcode)进行区分,所以等测序数据下机后,首先要通过样本标签进行序列拆分,得到每个样本的原始测序序列,然后对原始数据进行质控,具体质量控制条件如下:

23、去除接头(adapter)序列:在高通量测序过程中,打断之后的dna片段两端都会加上接头序列,接头序列的作用是在pcr反应中使引物定向结合到模板dna上,防止引物在pcr反应中的非特异性扩增和引物自身的二聚体形成,当插入片段的长度小于测序的读长时,接头序列就会出现在测序结果中引起污染,因此质控的时候要将其进行切除;

24、去除首尾的低质量序列:在测序循环初始阶段本文档来自技高网...

【技术保护点】

1.一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,步骤S1中所述耐药基因比对数据库的构建方法包括如下步骤:

3.根据权利要求1所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,步骤S1中所述细菌耐药基因注释数据库的构建方法包括如下步骤:

4.根据权利要求1所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,步骤S3中所述质量控制的步骤为:(1)去除接头序列;(2)去除首尾的低质量序列;(3)去除read中含有N碱基的序列;(4)去除单一碱基占比超过80%或者两种碱基占比超过90%的序列;(5)去除重复序列;(6)去除低复杂度序列。

5.根据权利要求4所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,所述质量控制的合格标准为:(1)Q30碱基数据量占比大于80%;(2)接头污染比例不超过1%;(3)有效序列长度不小于45bp;(4)数据的有效数据量应大于70%。

6.根据权利要求1所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,步骤S7中所述筛选耐药基因的条件为Gap数目为0,Miss_match数目为0,E_value值为0,Identity值为100并且Align_length大于200。

...

【技术特征摘要】

1.一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,步骤s1中所述耐药基因比对数据库的构建方法包括如下步骤:

3.根据权利要求1所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,步骤s1中所述细菌耐药基因注释数据库的构建方法包括如下步骤:

4.根据权利要求1所述一种基于宏基因组二代测序的细菌耐药基因检测方法,其特征在于,步骤s3中所述质量控制的步骤为:(1)去除接头序列;(2)去除首尾的低质量序列;(3)去除read中含有n碱基的序列;(4)去除单一碱基...

【专利技术属性】
技术研发人员:周淑芳胡亮李姗姗
申请(专利权)人:洛兮医疗科技河北有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1