当前位置: 首页 > 专利查询>南开大学专利>正文

基于测序数据的自动化血清型分析鉴定方法及系统技术方案

技术编号:34691661 阅读:17 留言:0更新日期:2022-08-27 16:26
本申请提供一种基于测序数据的自动化血清型分析鉴定方法及系统,涉及基因测序数据分析技术领域,该方法包括:获取微生物基因组测序数据;将微生物基因组测序数据与关键等位基因数据库中的各关键等位基因进行比对,记录相似度大于预设阈值的关键等位基因和相应的比对评分;根据关键等位基因和相应的比对评分,确定微生物基因组测序数据所属的生物体;使用生物体的关键等位基因,确定序列型数据库中的序列型;使用序列型搜索血清型数据库,根据序列型和血清型之间的映射关系确定微生物基因组测序数据的血清型,以实现生物信息学分析鉴定的自动化,同时,能够针对不同平台产生的短读长和长读长测序数据进行定制的生物信息学分析,得到准确的分析结果。得到准确的分析结果。得到准确的分析结果。

【技术实现步骤摘要】
基于测序数据的自动化血清型分析鉴定方法及系统


[0001]本申请属于基因测序数据分析
,尤其涉及一种基于测序数据的自动化血清型分析鉴定方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本申请相关的
技术介绍
信息,不必然构成在先技术。
[0003]基于微生物基因组测序数据信息的血清分型技术广泛应用要求分析程序的自动化血清分型流程。对于单物种的血清型分析的研究已经取得了一定的成果。
[0004]专利技术人发现,现有的对于血清分型的工作通常专注于单物种的微生物测序数据分析,尤其是沙门氏菌血清型的鉴定分析,无法满足目前快速发展的大量的多物种的测序数据的分析需求。并且它们涉及的方面通常不够全面,仅专注于序列型或血清型的单个方面,无法兼顾多个方面,也无法将多个方面的信息联系起来。

技术实现思路

[0005]为克服现有技术的不足,本申请提供基于测序数据的自动化血清型分析鉴定方法及系统,用于多物种血清型的鉴定,以及定制的生物信息学分析,有利于提高血清型分析鉴定结果的准确率。
[0006]本申请采用的技术方案如下:
[0007]第一方面,本申请实施例提供一种基于测序数据的自动化血清型分析鉴定方法,包括:
[0008]获取微生物基因组测序数据;
[0009]将所述微生物基因组测序数据与关键等位基因数据库中的各关键等位基因进行比对,记录相似度大于预设阈值的关键等位基因和相应的比对评分;
[0010]根据所述关键等位基因和相应的比对评分,确定所述微生物基因组测序数据所属的生物体;
[0011]使用所述生物体的关键等位基因,确定序列型数据库中的序列型;使用所述序列型搜索血清型数据库,根据序列型和血清型之间的映射关系确定所述微生物基因组测序数据的血清型。
[0012]在一种可能的实施方式中,在获取微生物基因组测序数据之前,还包括:构建关键等位基因

序列型

血清型关联数据库(下文简称为关联数据库)。
[0013]在一种可能的实施方式中,所述关联数据库的构建过程包括:收集相关关键等位基因、序列型和血清型信息;挖掘关键等位基因与序列型的关联关系、序列型与血清型的关联关系,以及关键等位基因、序列型、血清型的信息;根据上述关联关系与信息构建所述关键等位基因

序列型

血清型关联数据库。
[0014]在一种可能的实施方式中,所述关键等位基因

序列型

血清型关联数据库包括关
键等位基因数据库、序列型数据库和血清型数据库,各数据库通过索引建立关联关系;所述序列型数据库记录关键等位基因的不同组合到每个生物体序列类型的映射关系;所述血清型数据库记录序列类型与血清型之间的关联关系,用于多种微生物的血清型鉴定。
[0015]在一种可能的实施方式中,根据大数定律计算关联数据库中一种生物体序列类型的每个血清型频率,根据所述频率确定出生物体的血清型为已知血清型的概率;根据所述概率确定序列类型与血清型之间的关联关系。
[0016]在一种可能的实施方式中,使用sigmoid评分策略来评估所述微生物基因组测序数据所属的生物体。
[0017]在一种可能的实施方式中,通过以下方式评估所述微生物基因组测序数据所属的生物体:
[0018][0019][0020]其中,x表示生物体的等位基因座中不同等位基因的数量,θ表示与标记相关的权重,s表示与生物体的一个等位基因相关的得分;allele表示生物体的关键等位基因,alleles表示生物体的所有关键等位基因,f表示生物体的最终得分;根据最终得分确定所述微生物基因组测序数据所属的生物体。
[0021]第二方面,本申请实施例提供一种基于测序数据的自动化血清型分析鉴定系统,包括:
[0022]获取模块,用于获取微生物基因组测序数据;
[0023]比对模块,用于将所述微生物基因组测序数据与关键等位基因数据库中的各关键等位基因进行比对,记录相似度大于预设阈值的关键等位基因和相应的比对评分;
[0024]确定模块,用于根据所述关键等位基因和相应的比对评分,确定所述微生物基因组测序数据所属的生物体;
[0025]鉴定模块,用于使用所述生物体的关键等位基因,确定序列型数据库中的序列型;使用所述序列型搜索血清型数据库,根据序列型和血清型之间的映射关系鉴定所述微生物基因组测序数据的血清型。
[0026]第三方面,本申请实施例提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述第一方面和第一方面任一种可能的实施方式中所述的基于测序数据的自动化血清型分析鉴定方法的步骤。
[0027]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面和第一方面任一种可能的实施方式中所述的基于测序数据的自动化血清型分析鉴定方法的步骤。
[0028]本申请的有益效果是:
[0029]通过自动化生物信息学分析步骤,包括:获取微生物基因组测序数据;将微生物基因组测序数据与关键等位基因数据库中的各关键等位基因进行比对,记录相似度大于预设阈值的关键等位基因和相应的比对评分;根据关键等位基因和相应的比对评分,确定所述
微生物基因组测序数据所属的生物体;使用生物体的关键等位基因,确定序列型数据库中的序列型;使用序列型搜索血清型数据库,根据序列型和血清型之间的映射关系确定微生物基因组测序数据的血清型,能够针对不同平台产生的短读长和长读长测序数据进行定制的生物信息学分析,得到准确的分析结果。
附图说明
[0030]构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
[0031]图1是本申请实施例所提供的基于测序数据的自动化血清型分析鉴定方法的流程图;
[0032]图2是本申请另一实施例所提供的基于测序数据的自动化血清型分析鉴定方法的流程图;
[0033]图3是本申请实施例所提供的键等位基因

序列型

血清型关联数据库的结构图;
[0034]图4是本申请实施例所提供的基于测序数据的自动化血清型分析鉴定系统的结构图;
[0035]图5是本申请实施例所提供的一种计算机设备的示意图。
具体实施方式
[0036]下面结合附图与实施例对本申请作进一步说明。
[0037]应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。
[0038]需要注意的是,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于测序数据的自动化血清型分析鉴定方法,其特征在于,包括:获取微生物基因组测序数据;将所述微生物基因组测序数据与关键等位基因数据库中的各关键等位基因进行比对,记录相似度大于预设阈值的关键等位基因和相应的比对评分;根据所述关键等位基因和相应的比对评分,确定所述微生物基因组测序数据所属的生物体;使用所述生物体的关键等位基因,确定序列型数据库中的序列型;使用所述序列型搜索血清型数据库,根据序列型和血清型之间的映射关系确定所述微生物基因组测序数据的血清型。2.如权利要求1所述的自动化血清型分析鉴定方法,其特征在于,在获取微生物基因组测序数据之前,还包括:构建关键等位基因

序列型

血清型关联数据库。3.如权利要求2所述的自动化血清型分析鉴定方法,其特征在于,所述关联数据库的构建过程包括:收集相关关键等位基因、序列型和血清型信息;挖掘关键等位基因与序列型的关联关系、序列型与血清型的关联关系,以及关键等位基因、序列型、血清型的信息;根据上述关联关系与信息构建所述关键等位基因

序列型

血清型关联数据库。4.如权利要求3所述的自动化血清型分析鉴定方法,其特征在于,所述关键等位基因

序列型

血清型关联数据库包括关键等位基因数据库、序列型数据库和血清型数据库,各数据库通过索引建立关联关系;所述序列型数据库记录关键等位基因的不同组合到每个生物体序列类型的映射关系;所述血清型数据库记录序列类型与血清型之间的关联关系,用于多种微生物的血清型鉴定。5.如权利要求4所述的自动化血清型分析鉴定方法,其特征在于,根据大数定律计算关键等位基因

序列型

血清型关联数据库中一种生物体序列类型的每个血清型频率,根据所述频率确定出生物体...

【专利技术属性】
技术研发人员:刘健孙嘉良陈娇
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1