一种mNGS病原体数据分析方法技术

技术编号:29136670 阅读:40 留言:0更新日期:2021-07-02 22:32
本发明专利技术提供了一种宏基因组二代测序mNGS数据分析的方法,其包括如下步骤:1)样本核酸提取、建库测序;2)数据处理;3)计算RPM(Micro)、RPM(Micro)

【技术实现步骤摘要】
一种mNGS病原体数据分析方法
本专利技术涉及一种宏基因组二代测序mNGS数据分析的方法或系统,及其在感染性疾病病原体数据分析中的用途。
技术介绍
感染性疾病是危重患者死亡的主要原因。病原学鉴定是感染性疾病诊断中最重要的环节。传统的病原体鉴定方法包括培养分离、形态学检测、生化检测、免疫学检测以及核酸检测(例如PCR检测),是针对一种或几种病原体目标性的鉴别。宏基因组二代测序(metagenomicsnextgenerationsequencing,mNGS)直接对样本中的核酸进行高通量测序然后与数据库进行比对分析,通过核酸序列信息判断病原体种类,能广泛覆盖病原体,只要是数据库中的物种都能覆盖,不需要预先猜测可能的病原体。mNGS在感染性疾病中的应用最早是在中枢神经系统感染中(1:WilsonMR,NaccacheSN,SamayoaE,etal.Actionablediagnosisofneuroleptospirosisbynext-generationsequencing[J].NEnglJMed,2014,370(25):2408本文档来自技高网...

【技术保护点】
1.一种宏基因组二代测序(mNGS)数据分析的方法:/n1)样本核酸提取、建库测序:对待检测病原体感染的样本进行核酸提取,建库测序,得到宏基因组测序数据;/n2)数据处理:对测序数据按索引序列的不同进行拆分,过滤低质量的数据,数据去重,得到Unique数据集合,即Unique Reads数,去除人源序列;/n剩余的测序片段对微生物数据库使用基于K-mer算法进行序列的物种分类,分到微生物的总和为Micro数据集合,即Micro Reads数,每个具体微生物物种的集合为SpeciesReads数;/n3)NTC过滤:计算RPM(Micro),和/或对样本中的每个物种RPM(Micro)与同一批N...

【技术特征摘要】
1.一种宏基因组二代测序(mNGS)数据分析的方法:
1)样本核酸提取、建库测序:对待检测病原体感染的样本进行核酸提取,建库测序,得到宏基因组测序数据;
2)数据处理:对测序数据按索引序列的不同进行拆分,过滤低质量的数据,数据去重,得到Unique数据集合,即UniqueReads数,去除人源序列;
剩余的测序片段对微生物数据库使用基于K-mer算法进行序列的物种分类,分到微生物的总和为Micro数据集合,即MicroReads数,每个具体微生物物种的集合为SpeciesReads数;
3)NTC过滤:计算RPM(Micro),和/或对样本中的每个物种RPM(Micro)与同一批NTC中的每个物种RPM(Micro)进行比较,计算RPM(Micro)比例;其中RPM(Micro)、RPM(Micro)比例具体计算方法如下:






其中,PRM(Micro)为每百万Reads数的测序数据量中每种微生物的Reads数,NTC为阴性对照,即水;分母不能为0,当RPM(Micro)NTC为0时,则按1计算;
对RPM(Micro)比例设置相应的阳性判断值,对样本中的每个物种的微生物进行判断;
4)显著性分析:寻找并验证为阴性的临床样本作为背景库;统计背景库中每个物种RPM(Micro)的检出分布,包括最大值、最小值、中位数、平均数和/或标准差;将步骤3)中判断为阳性的微生物的RPM(Micro)与背景库中该微生物的RPM(Micro)进行显著性分析,若显著高于背景库,则报出该微生物分析结果为阳性。


2.如权利要求1所述的方法,其中还包括步骤:
5)置信度分析:对于显著高于背景库的微生物进行置信度分析,若为高置信度,则报出该微生物分析结果为阳性。


3.如权利要求1或2所述的方法,步骤3)中,RPM(Micro)比例设置相应的阳性判断值为:RPM(Micro)比例≥m,其中m为1-100的自然数,优选地,m为5-50的自然数;对于难检测到、临床有重要意义的特殊微生物:SpeciesReads数≥1,即为阳性。


4.如权利要求3所述的方法,其中特殊微生物为结核杆菌或布鲁氏菌。


5.如权利要求1或2所述的方法,其中步骤4)中所述显著高于背景库是指,将背景库检出的微生物RPM(Micro)值进行统计分析,确定各个微生物的阈值;样本中检出微生物的RPM(Micro)样本值和背景库的数值进行显著性分析;若显著高于背景库,则该微生物不是“背景”微生物。


6.如权利要求5所述的方法,所述显著高于背景库是指:该微生物P≤0.01。


7.如权利要求2所述的方法,其中步骤5)中所述置信度分析指标包括SpeciesReads数、属内丰度、种丰度、覆盖度、离散度;如微生物指标的参数符合置信度要求,则该微生物置信度为高置信度,否则为低置信度。


8.如权利要求1所述的方法,步骤1)中所述测序通过测序仪进行,所述测序仪选自Illumina、Life测序仪,优选Nextseq500;所述测序方式为SE50、SE75、SE100、SE150、SE200、PE50、PE100、PE150或PE200,优选SE75。


9.如权利要求1或2所述的方法,所述步骤1)测序总数据量≥15M。


10.如权利要求1或2所述的方法,所述步骤4)中阴性的临床样本选自以下的一个或多个:血液、淋巴液、间隙液、脑脊液、肺泡灌洗液、支气管灌洗液、痰液、胸腹水、尿液、唾液、粪便、实验室环境样本或采样环境样本。


11.如权利要求10所述的方法,其中,每种类型的阴性临床样本不少于50例,优选不少100例。


12.一种用于宏基因组二代测序(mNGS)数据分析的系统,包括:
1)数据提取模块:对待检测病原体感染的样本进行核酸提取,建库测序,得到宏基因组测序数据;
2)计算处理模块:用于对测序数据按索引序列的不同进行拆分,过滤低质量的数据,数据去重,得到unique数据集合,即UniqueReads数,去除人源序列;
剩余的测序片段对微生物数据库使用基于K-mer算法进行序列的物种分类,分到微生...

【专利技术属性】
技术研发人员:李川马丽娟侯倩倩舒小婷魏少华
申请(专利权)人:欧蒙医学诊断中国有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1