System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于宏基因组测序数据的病原微生物鉴别分析方法技术_技高网

一种基于宏基因组测序数据的病原微生物鉴别分析方法技术

技术编号:41332190 阅读:15 留言:0更新日期:2024-05-20 09:52
本发明专利技术涉及一种基于宏基因组测序数据的病原微生物鉴别分析方法,该分析方法综合考虑了多个评价因素,如:种序列数、Unique序列数占比、k‑mer占比、相对丰度、临床致病等级、阴控检出程度和同批次检出情况等,确定出治病评估指标并计算出致病得分,然后通过致病得分和致病阈值之间的大小关系,进行致病微生物数据库、背景微生物数据库以及特殊关注数据库分类筛选,最后可以输出致病菌。本发明专利技术通过综合考虑多因素的治病评估指标,能够全面、定量的评估样本中各菌种的致病风险,更准确的判断一个菌种是否具有较高的致病潜力,有助于提高病原微生物的鉴别准确性和鉴定结果的可靠性。

【技术实现步骤摘要】

本专利技术涉及病原微生物鉴定,尤其是一种基于宏基因组测序数据的病原微生物鉴别分析方法


技术介绍

1、病原微生物是指一类能够引起人类或者动物感染,进而导致疾病发生的微生物,包括细菌、真菌、病毒、寄生虫、非经典微生物等。由病原微生物所引起的疾病传染性都很强,有可能造成世界性的大流行,因此在病原微生物的检测方面需要做到精准、快速、高效和便捷。

2、宏基因组(mngs)测序技术是目前临床鉴定病原微生物的有效技术之一,相比于传统的微生物检测方法,宏基因组测序技术可以直接针对样本中的全部核酸进行无偏性测序,从而实现检测到样本中的所有微生物。这项技术可以快速准确地检测出导致疾病的病原微生物,并为病原学诊断和新发传染病病原体的鉴定提供重要价值。

3、目前,宏基因组测序技术在受到环境、实验背景和人体微生态等因素的影响下,所得到的结果比较复杂。鉴于这一情况,需要依靠人工对测序结果进行分析和筛选。然而,人工筛选存在一定的局限性。首先,人工筛选需要耗费相当长的时间,这可能导致结果的延迟。其次,由于人工操作的主观性,存在结果遗漏的可能性。此外,解读结果的准确性也高度依赖于解读人员的专业水平和经验。因此,为了克服这些局限性,需要进一步探索自动化和智能化的分析工具,以提高宏基因组测序技术的数据处理效率和结果的准确性。


技术实现思路

1、基于上述问题,本专利技术提供一种基于宏基因组测序数据的病原微生物鉴别分析方法。该方法通过综合评估多个致病指标,确定样本中每个物种的致病得分;通过设置适当的阈值,本专利技术可以从样本中判断致病病原微生物,实现对物种的致病风险的自动分析,大大提高了解读过程的快速性和准确性,也为未来智能化病原微生物鉴定技术的发展提供了有益的参考。

2、本专利技术的具体技术方案为:

3、一种基于宏基因组测序数据的病原微生物鉴别分析方法,包括以下步骤:

4、步骤s1:对样本数据进行核酸提取、建库和测序,得到原始的病原宏基因组测序数据,对所述宏基因组测序数据进行数据处理,得到微生物测序数据;

5、步骤s2:微生物测序数据拆分成k-mer序列特征并进行物种鉴定,得到样本中菌种列表;

6、步骤s3:设置物种的致病菌评估指标以及对应的权重;

7、步骤s4:根据物种的致病菌评估指标中的对应指标,设置每项指标中的具体指标,并计算相应的权重;

8、步骤s5:根据致病菌评估指标计算相应的指标权重,最终计算致病得分score;

9、步骤s6:根据物种的致病得分及其致病等级进行分类筛选,输出致病病原。

10、本专利技术方法在评估致病原过程中,考虑到了解物种的致病风险是由多种因素(物种的测序数据、该物种的致病性、阴控检出数据和同批次检出数据)共同作用的,因此将物种的测序数据、该物种的致病性、阴控检出数据和同批次检出数据作为致病原判断的评价指标,分别对这四个指标下的致病风险进行量化,再综合对其致病风险进行综合量化,因而实现基于病原微生物再致病性的全面、整体、有效评价。

11、进一步,步骤s1中对原始数据处理包括:拆分引物barcode、过滤低质量数据以及去除人源序列,得到只包含病原微生物序列信息的数据集。

12、进一步,步骤s3所述致病菌评价指标包括物种测序数据、该物种致病性、阴控检出数据和同批次检出数据。

13、进一步,步骤s4所述过程包括:

14、步骤s41:根据物种鉴定结果获得种序列数、unique序列数、k-mer占比和相对丰度,并确定物种测序数据的评价指标,包括序列数和相对丰度,并计算测序数据的有效权重w1;

15、步骤s42:根据临床关注情况、病原的致病程度以及文献报道情况,构建物种致病等级数据库,将所述致病等级数据库分为:i级、ii级和iii级,获取物种的致病权重w2:

16、步骤s43:计算本次实验阴控中该物种的序列数和历史阴控检出率,获取物种的阴控检出权重w3;

17、步骤s44:计算同批次样本的检出情况,包括同批次样本中检出序列数的最大值、最小值、平均数、中位数,计算物种的同批次检出权重w4;

18、进一步,步骤s5中,总权重为所有权重相加得到致病得分score,计算公式如下:

19、

20、进一步,步骤s6中,计算样本t1中的所有物种权重并排序,根据致病得分和致病阈值大小关系,进行致病微生物数据库、背景微生物数据库以及特殊关注数据库分类筛选,最后输出致病菌。

21、与现有技术相比,本专利技术具有以下优点:

22、本专利技术的病原微生物鉴别分析方法综合考虑了多个评价因素(如种序列数、unique序列数占比、k-mer占比、相对丰度、临床致病等级、阴控检出程度和同批次检出情况),确定出治病评估指标并计算出致病得分,然后通过致病得分和致病阈值之间的大小关系,进行致病微生物数据库、背景微生物数据库以及特殊关注数据库分类筛选,最后可以输出致病菌。上述方法能够全面、定量的评估样本中各菌种的致病风险,更准确的判断一个菌种是否具有较高的致病潜力,有助于提高病原微生物的鉴别准确性和鉴定结果的可靠性。

本文档来自技高网...

【技术保护点】

1.一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S3所述物种测序数据权重设置为0.445-0.450,所述物种临床致病性权重设置为0.245-0.250,所述阴控检出数据分析权重设置为0.145-0.150,所述同批次检出数据分析的权重设置为0.145-0.150。

3.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S41所述有效权重W1的种序列数为0.450-0.550,相对丰度为0.450-0.550,权重之和为1。

4.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S41中序列数有效权重由所述种序列数、Unique序列数占比和k-mer占比三个子指标共同决定;其中,所述种序列数权重为0.540,所述Unique序列数占比权重为0.300,所述k-mer特征数量占比权重为0.160。

5.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S42所述致病等级数据库包括常见致病微生物和常见背景定植微生物,致病等级微生物中I级的权重为0.89-0.91,II级权重为0.69-0.71,III级权重为0.49-0.51;常见背景定植微生物中I级的权重为0.49-0.51,II级权重为0.29-0.31,III级权重为0.09-0.11。

6.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S43所述阴控中该物种的序列数包括同批次样本阴控中有样本-阴控率和实验室的阴控总检出率,所述同批次样本阴控的权重为0.745-0.755,所述实验室的阴控总检出率权重为0.245-0.255。

7.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S44中,所述种序列数=最高检出序列数时,赋予权重为1;当中位数≤种序列数<最高检出序列数时,赋予权重为0.75;当种序列数在中位数和平均数之间,赋予权重0.5;当最低检出序列数<种序列数<平均数时,赋予权重0.25;当检出序列数=最低检出序列数时,赋予权重0.1。

8.根据权利要求1-7所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S5中,总权重为所有权重相加得到致病得分Score,计算公式如下:

9.根据权利要求8所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤S6中,通过计算样本中的所有物种权重并排序,设置致病阈值;根据致病得分和致病阈值大小关系,筛选判定致病菌,包括以下步骤:

...

【技术特征摘要】

1.一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤s3所述物种测序数据权重设置为0.445-0.450,所述物种临床致病性权重设置为0.245-0.250,所述阴控检出数据分析权重设置为0.145-0.150,所述同批次检出数据分析的权重设置为0.145-0.150。

3.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤s41所述有效权重w1的种序列数为0.450-0.550,相对丰度为0.450-0.550,权重之和为1。

4.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤s41中序列数有效权重由所述种序列数、unique序列数占比和k-mer占比三个子指标共同决定;其中,所述种序列数权重为0.540,所述unique序列数占比权重为0.300,所述k-mer特征数量占比权重为0.160。

5.根据权利要求1所述的一种基于宏基因组测序数据的病原微生物鉴别分析方法,其特征在于,步骤s42所述致病等级数据库包括常见致病微生物和常见背景定植微生物,致病等级微生物中i级的权重为0.89-0.91,ii级权重为0.69-0.71,iii级权重为0.49-0...

【专利技术属性】
技术研发人员:吴柏旭胡亮谢展
申请(专利权)人:洛兮基因科技杭州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1