人源性病毒检测方法及装置、设备、存储介质制造方法及图纸

技术编号:38635028 阅读:15 留言:0更新日期:2023-08-31 18:31
本发明专利技术属于生物信息学技术领域,公开了一种人源性病毒检测方法及装置、设备、存储介质,通过对多个目标基因序列进行聚类分类获得多个聚类类别,将每个聚类类别中的代表性序列与人源性病毒对应的目标扩增子序列进行比对,获得比对结果,然后根据比对结果计算比对上目标扩增子序列的目标指标值、覆盖度和平均覆盖深度,输入分类模型进行预测获得分类结果,该分类结果用于表征从基因测序数据中是否检测到人源性病毒,从而无需将目标基因序列逐个与目标扩增子序列进行比对,可以大大降低比对耗时,进而提高检测效率。进而提高检测效率。进而提高检测效率。

【技术实现步骤摘要】
人源性病毒检测方法及装置、设备、存储介质


[0001]本专利技术属于生物信息学
,具体涉及一种基于基因测序数据的人源性病毒检测方法及装置、设备、存储介质。

技术介绍

[0002]在科研、临床检测等领域,常常需要对人源性病毒,例如丙肝病毒(hepatitis C virus,HCV)的个别基因或全基因组的基因型进行检测。
[0003]传统上设置有丙肝预测评价的健康管理系统,其使用的预测方式为数据匹配。其原理是将个人生活数据输入系统由系统匹配固定数据然后得出患病几率。但由于人体和疾病的复杂性、不可预测性,在生物信号与信息的表现形式上对其进行检测与信号表达,获取的数据及信息的分析、决策等诸多方面都存在非常复杂的非线性联系。所以使用传统的数据匹配只能是盲目的数据筛查,无法判断数据与数据之间的逻辑关联以及变量,得到的值域偏差大,造成系统预测的特异性十分差,所以无法有效对个人的丙肝病毒进行准确预测。
[0004]近年来,随着测序技术的发展,聚合酶链式反应(Polymerase Chain Reaction,PCR)技术是应用最广泛的一种实时在线的检测技术,基于PCR的分子标记方法为目的基因的筛选提供了成熟的工具。既能够对靶基因进行定性,又能够定量,是近年来进行检测的新的“黄金标准”。基于PCR技术的HCV检测系统代替了人员对用HCV数据库和临床文献的检索,结果判读由人工转变为电脑自动化,可一次性处理大批量实验数据,减少了人员操作过程中的出错率,有利于项目的临床推广。但是在实践中发现,每个样本的测序序列达到几百万条,将每条测序序列与数据库进行比对,比对过程耗时,导致检测效率较低。

技术实现思路

[0005]本专利技术的目的在于提供一种人源性病毒检测方法及装置、设备、存储介质,可以降低比对耗时,进而提高检测效率。
[0006]本专利技术第一方面公开一种人源性病毒检测方法,包括:对基因测序数据进行处理,获得多个目标基因序列;对多个所述目标基因序列进行聚类分类,获得多个聚类类别;将每个所述聚类类别中的代表性序列与目标扩增子序列进行比对,获得比对结果;其中,所述目标扩增子序列根据人源性病毒的全基因组序列而确定;根据所述比对结果,计算比对上所述目标扩增子序列的目标指标值、覆盖度和平均覆盖深度;将所述目标指标值、所述覆盖度和所述平均覆盖深度,输入预先训练的分类模型获得分类结果;所述分类结果用于表征从所述基因测序数据中是否检测到所述人源性病毒。
[0007]本专利技术第二方面公开一种人源性病毒检测装置,包括:处理单元,用于对基因测序数据进行处理,获得多个目标基因序列;
聚类单元,用于对多个所述目标基因序列进行聚类分类获得多个聚类类别;比对单元,用于将每个所述聚类类别中的代表性序列与目标扩增子序列进行比对,获得比对结果;其中,所述目标扩增子序列根据人源性病毒的全基因组序列而确定;计算单元,用于根据所述比对结果,计算比对上所述目标扩增子序列的目标指标值、覆盖度和平均覆盖深度;预测单元,用于将所述目标指标值、所述覆盖度和所述平均覆盖深度,输入预先训练的分类模型获得分类结果;所述分类结果用于表征从所述基因测序数据中是否检测到所述人源性病毒。
[0008]本专利技术第三方面公开一种电子设备,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行第一方面公开的人源性病毒检测方法。
[0009]本专利技术第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行第一方面公开的人源性病毒检测方法。
[0010]本专利技术的有益效果在于,通过对多个目标基因序列进行聚类分类获得多个聚类类别,将每个聚类类别中的代表性序列与人源性病毒对应的目标扩增子序列进行比对,获得比对结果,然后根据比对结果计算比对上目标扩增子序列的目标指标值、覆盖度和平均覆盖深度,输入分类模型进行预测获得分类结果,该分类结果用于表征从基因测序数据中是否检测到人源性病毒,从而无需将目标基因序列逐个与目标扩增子序列进行比对,可以大大降低比对耗时,进而提高检测效率。
附图说明
[0011]此处的附图,示出了本专利技术所述技术方案的具体实例,并与具体实施方式构成说明书的一部分,用于解释本专利技术的技术方案、原理及效果。
[0012]除非特别说明或另有定义,不同附图中,相同的附图标记代表相同或相似的技术特征,对于相同或相似的技术特征,也可能会采用不同的附图标记进行表示。
[0013]图1是本专利技术实施例公开的一种人源性病毒检测方法的流程图;图2是本专利技术实施例公开的一种人源性病毒检测装置的结构示意图;图3是本专利技术实施例公开的一种电子设备的结构示意图。
[0014]附图标记说明:201、处理单元;202、聚类单元;203、比对单元;204、计算单元;205、预测单元;301、存储器;302、处理器。
具体实施方式
[0015]为了便于理解本专利技术,下面将参照说明书附图对本专利技术的具体实施例进行更详细的描述。
[0016]除非特别说明或另有定义,本文所使用的所有技术和科学术语与所属
的技术人员通常理解的含义相同。在结合本专利技术的技术方案以现实的场景的情况下,本文所使用的所有技术和科学术语也可以具有与实现本专利技术的技术方案的目的相对应的含义。本文所使用的“第一、第二
…”
仅仅是用于对名称的区分,不代表具体的数量或顺序。本文所使
用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0017]需要说明的是,当元件被认为“固定于”另一个元件,它可以是直接固定在另一个元件上,也可以是存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件,也可以是同时存在居中元件;当一个元件被认为是“安装在”另一个元件,它可以是直接安装在另一个元件,也可以是同时存在居中元件。当一个元件被认为是“设在”另一个元件,它可以是直接设在另一个元件,也可以是同时存在居中元件。
[0018]除非特别说明或另有定义,本文所使用的“所述”、“该”为相应位置之前所提及或描述的技术特征或
技术实现思路
,该技术特征或
技术实现思路
与其所提及的技术特征或
技术实现思路
可以是相同的,也可以是相似的。此外,本文所使用的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0019]如图1所示,本专利技术实施例公开一种人源性病毒检测方法,该方法可以通过计算机编程实现。该方法的执行主体可为如计算机电脑、笔记本电脑、平板电脑等电子设备,或内嵌于电子设备中的人源性病毒检测装置,本专利技术对此不作限定。在本实施例中,该方法包括以下步骤110~150:110、对基因测序数据进行处理,获得多个目标基因序列。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.人源性病毒检测方法,其特征在于,包括:对基因测序数据进行处理,获得多个目标基因序列;对多个所述目标基因序列进行聚类分类,获得多个聚类类别;将每个所述聚类类别中的代表性序列与目标扩增子序列进行比对,获得比对结果;其中,所述目标扩增子序列根据人源性病毒的全基因组序列而确定;根据所述比对结果,计算比对上所述目标扩增子序列的目标指标值、覆盖度和平均覆盖深度;将所述目标指标值、所述覆盖度和所述平均覆盖深度,输入预先训练的分类模型获得分类结果;所述分类结果用于表征从所述基因测序数据中是否检测到所述人源性病毒。2.如权利要求1所述的人源性病毒检测方法,其特征在于,对基因测序数据进行处理,获得多个目标基因序列,包括:对基因测序数据进行过滤,获得第一基因序列;将所述第一基因序列与内参基因的参考序列进行比对,获得比对上的第二基因序列;根据所述第一基因序列和所述第二基因序列的数量,计算比对上所述参考序列的参考指标值;当所述参考指标值达到指定阈值时,从所述第一基因序列中去除所述第二基因序列,获得多个目标基因序列。3.如权利要求2所述的人源性病毒检测方法,其特征在于,根据所述第一基因序列和所述第二基因序列的数量,计算比对上所述参考序列的参考指标值,包括:通过以下公式计算比对上所述参考序列的参考指标值:其中,R1代表参考指标值,n1代表比对上的第二基因序列的数量,n2代表过滤后的第一基因序列的数量。4.如权利要求2所述的人源性病毒检测方法,其特征在于,所述比对结果包括比对上的代表性序列的序列数;根据所述比对结果,计算比对上所述目标扩增子序列的目标指标值,包括:通过以下公式计算比对上所述目标扩增子序列的目标指标值:其中,R2代表目标指标值,n3代表比对上的代表性序列的序列数,n2代表过滤后的第一基因序列的数量。5.如权利要求1至4任一项所述的人源性病毒检测方法,其特征在于,对多个所述目标基因序列进行聚类分类,获得多个聚类类别,包括:对多个所述目标基因序列进行聚类分类,获得多个分类类别;获取每个所述分类类别的目标基因...

【专利技术属性】
技术研发人员:夏慧华杨悦王谷丰刘二凯赵陆洋
申请(专利权)人:深圳赛陆医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1