兼容多荧光信号平台的农作物品种基因型分型方法及装置制造方法及图纸

技术编号:38362379 阅读:29 留言:0更新日期:2023-08-05 17:30
本发明专利技术提供一种兼容多荧光信号平台的农作物品种基因型分型方法及装置,涉及计算机技术领域,方法包括:获取目标荧光信号平台的至少一个目标农作物品种在基因组的多个位点的目标荧光信号数据;对各位点的多个目标荧光信号数据进行转换,得到各位点对应的多个转换后的目标荧光信号数据;采用聚类算法对各位点对应的多个转换后的目标荧光信号数据进行聚类,得到各位点分别对应的第一标记特征;将各第一标记特征分别与对应位点的第二标记特征进行匹配,确定各目标农作物品种在各位点的基因型分型结果,实现了各目标农作物品种在各位点的基因型分型结果的确定,提升了目标农作物品种在各位点的基因型分型结果的准确性。在各位点的基因型分型结果的准确性。在各位点的基因型分型结果的准确性。

【技术实现步骤摘要】
兼容多荧光信号平台的农作物品种基因型分型方法及装置


[0001]本专利技术涉及计算机
,尤其涉及一种兼容多荧光信号平台的农作物品种基因型分型方法及装置。

技术介绍

[0002]基于荧光信号平台的基因分型技术,常用的荧光信号平台包括实时荧光定量聚合酶链式反应(Polymerase Chain Reaction,PCR)、竞争性等位基因特异性PCR(Kompetitive Allele Specific PCR,KASP)和基因芯片。对于实时荧光定量PCR检测系统,通过荧光染料检测每次PCR循环后产物总量的技术,分析软件会记录每次PCR扩增反应后产物的变化,通过ct值和标准曲线的关系对起始模版进行定量分析并进行基因分型。而KASP与基因芯片平台都采用终点法,即在反应完成后通过检测荧光信号强度进行基因分型判定,在实验室PCR反应的实验流程已相当成熟且统一。然而,通过荧光信号强度进行基因分型判定的方法,在不同物种和不同荧光平台上却各有差异,特别是对于高密度基因芯片,不能仅靠一套通用软件就能非常准确的对每一个探针进行分型。
[0003]相关技术中,在基于马氏距离分类器的鲁棒线性模型(Robust Linear Model with Mahalanobis distance classifier,RLMM)算法的基础上加入了贝叶斯(Bayesian)程序形成的BRLMM算法是目前大多数根据荧光信号强度进行基因分型判定的主流分析程序。
[0004]然而,虽然BRLMM算法在正确率和执行速度上相较于RLMM算法都有很大的提升,但BRLMM算法从设计之初就没有考虑不同物种上的遗传特性,由于其他物种的遗传背景与人类存在巨大差异,在使用该算法对其他物种的数据进行基因分型时通常会出现一些错误的基因分型,导致基因型数据分型的准确率低。

技术实现思路

[0005]本专利技术提供一种兼容多荧光信号平台的农作物品种基因型分型方法及装置,用以解决现有技术中基因型数据分型的准确率低的问题。
[0006]本专利技术提供一种兼容多荧光信号平台的农作物品种基因型分型方法,包括:获取目标荧光信号平台的至少一个目标农作物品种在基因组的多个位点的目标荧光信号数据;对各所述位点的多个目标荧光信号数据进行转换,得到各所述位点对应的多个转换后的目标荧光信号数据;采用聚类算法对各所述位点对应的多个转换后的目标荧光信号数据进行聚类,得到各所述位点分别对应的第一标记特征;所述第一标记特征包括至少一个目标聚类簇的聚类中心和各所述目标聚类簇包括的多个转换后的目标荧光信号数据的分布情况;将各所述第一标记特征分别与对应位点的第二标记特征进行匹配,确定各所述目标农作物品种在各所述位点的基因型分型结果;所述第二标记特征是基于至少一个荧光信
号平台对应的至少一个样本农作物品种在所述基因组的多个位点的样本荧光信号数据和所述聚类算法聚类得到的;所述第二标记特征包括至少一个最优聚类簇的聚类中心和各所述最优聚类簇包括的多个转换后的样本荧光信号数据的分布情况。
[0007]根据本专利技术提供的一种兼容多荧光信号平台的农作物品种基因型分型方法,所述第二标记特征是基于以下步骤得到的:获取各所述荧光信号平台对应的至少一个样本农作物品种在所述基因组的多个位点的样本荧光信号数据;针对每一个荧光信号平台,对各所述位点的多个样本荧光信号数据进行转换,得到各所述位点对应的多个转换后的样本荧光信号数据;采用高斯混合模型聚类算法对各所述位点对应的多个转换后的样本荧光信号数据进行多次高斯拟合计算,得到每次高斯拟合计算时各所述位点分别对应的至少一个初始聚类簇;基于各所述位点分别对应的各所述初始聚类簇,确定各所述位点分别对应的所述第二标记特征。
[0008]根据本专利技术提供的一种兼容多荧光信号平台的农作物品种基因型分型方法,所述基于各所述位点分别对应的各所述初始聚类簇,确定各所述位点分别对应的所述第二标记特征,包括:对各所述位点分别对应的各所述初始聚类簇进行评估,确定至少一个第一聚类簇;基于各所述第一聚类簇,确定各所述位点分别对应的所述第二标记特征。
[0009]根据本专利技术提供的一种兼容多荧光信号平台的农作物品种基因型分型方法,所述基于各所述第一聚类簇,确定各所述位点分别对应的所述第二标记特征,包括:对各所述第一聚类簇分别进行离群值检测,得到各所述第一聚类簇对应的离群点;将所述离群点分别从各所述第一聚类簇中去除,得到最优聚类簇;基于各所述最优聚类簇,确定各所述位点分别对应的所述第二标记特征。
[0010]根据本专利技术提供的一种兼容多荧光信号平台的农作物品种基因型分型方法,所述基于各所述最优聚类簇,确定各所述位点分别对应的所述第二标记特征,包括:将各所述最优聚类簇的聚类中心分别与除自身之外的最优聚类簇的聚类中心进行距离计算,得到至少一个距离值;基于各所述距离值,确定至少一个目标最优聚类簇;基于各所述目标最优聚类簇,确定各所述位点分别对应的所述第二标记特征。
[0011]根据本专利技术提供的一种兼容多荧光信号平台的农作物品种基因型分型方法,所述将各所述第一标记特征分别与对应位点的第二标记特征进行匹配,确定各所述目标农作物品种在各所述位点的基因型分型结果,包括:在各所述第一标记特征与对应位点的所述第二标记特征匹配成功的情况下,基于所述第二标记特征,确定所述目标农作物品种在各所述位点的基因型分型结果;在各所述第一标记特征与对应位点的所述第二标记特征匹配失败的情况下,基于各所述位点分别对应的目标聚类簇的数量、各所述目标聚类簇的聚类中心的目标值和预设
条件,确定各所述目标农作物品种在各所述位点的基因型分型结果。
[0012]根据本专利技术提供的一种兼容多荧光信号平台的农作物品种基因型分型方法,所述基于各所述位点分别对应的目标聚类簇的数量、各所述目标聚类簇的聚类中心的目标值和预设条件,确定各所述目标农作物品种在各所述位点的基因型分型结果,包括:基于各所述位点分别对应的目标聚类簇的数量,将各所述目标聚类簇的聚类中心的目标值和所述预设条件进行判断;基于判断的结果,确定各所述目标农作物品种在各所述位点的基因型分型结果。
[0013]本专利技术还提供一种兼容多荧光信号平台的农作物品种基因型分型装置,包括:获取模块,用于获取目标荧光信号平台的至少一个目标农作物品种在基因组的多个位点的目标荧光信号数据;转换模块,用于对各所述位点的多个目标荧光信号数据进行转换,得到各所述位点对应的多个转换后的目标荧光信号数据;聚类模块,用于采用聚类算法对各所述位点对应的多个转换后的目标荧光信号数据进行聚类,得到各所述位点分别对应的第一标记特征;所述第一标记特征包括至少一个目标聚类簇的聚类中心和各所述目标聚类簇包括的多个转换后的目标荧光信号数据的分布情况;分型模块,用于将各所述第一标记特征分别与对应位点的第二标记特征进行匹配,确定各所述目标农作物品种在各所述位点的基因型分型结果;所述第二标记特征是基于至少一个荧光信号平台对应的至少一个样本农作物品种在所述基因组的多个位点的样本荧光信号数据和所述聚类算法聚类得到的;所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种兼容多荧光信号平台的农作物品种基因型分型方法,其特征在于,包括:获取目标荧光信号平台的至少一个目标农作物品种在基因组的多个位点的目标荧光信号数据;对各所述位点的多个目标荧光信号数据进行转换,得到各所述位点对应的多个转换后的目标荧光信号数据;采用聚类算法对各所述位点对应的多个转换后的目标荧光信号数据进行聚类,得到各所述位点分别对应的第一标记特征;所述第一标记特征包括至少一个目标聚类簇的聚类中心和各所述目标聚类簇包括的多个转换后的目标荧光信号数据的分布情况;将各所述第一标记特征分别与对应位点的第二标记特征进行匹配,确定各所述目标农作物品种在各所述位点的基因型分型结果;所述第二标记特征是基于至少一个荧光信号平台对应的至少一个样本农作物品种在所述基因组的多个位点的样本荧光信号数据和所述聚类算法聚类得到的;所述第二标记特征包括至少一个最优聚类簇的聚类中心和各所述最优聚类簇包括的多个转换后的样本荧光信号数据的分布情况。2.根据权利要求1所述的兼容多荧光信号平台的农作物品种基因型分型方法,其特征在于,所述第二标记特征是基于以下步骤得到的:获取各所述荧光信号平台对应的至少一个样本农作物品种在所述基因组的多个位点的样本荧光信号数据;针对每一个荧光信号平台,对各所述位点的多个样本荧光信号数据进行转换,得到各所述位点对应的多个转换后的样本荧光信号数据;采用高斯混合模型聚类算法对各所述位点对应的多个转换后的样本荧光信号数据进行多次高斯拟合计算,得到每次高斯拟合计算时各所述位点分别对应的至少一个初始聚类簇;基于各所述位点分别对应的各所述初始聚类簇,确定各所述位点分别对应的所述第二标记特征。3.根据权利要求2所述的兼容多荧光信号平台的农作物品种基因型分型方法,其特征在于,所述基于各所述位点分别对应的各所述初始聚类簇,确定各所述位点分别对应的所述第二标记特征,包括:对各所述位点分别对应的各所述初始聚类簇进行评估,确定至少一个第一聚类簇;基于各所述第一聚类簇,确定各所述位点分别对应的所述第二标记特征。4.根据权利要求3所述的兼容多荧光信号平台的农作物品种基因型分型方法,其特征在于,所述基于各所述第一聚类簇,确定各所述位点分别对应的所述第二标记特征,包括:对各所述第一聚类簇分别进行离群值检测,得到各所述第一聚类簇对应的离群点;将所述离群点分别从各所述第一聚类簇中去除,得到最优聚类簇;基于各所述最优聚类簇,确定各所述位点分别对应的所述第二标记特征。5.根据权利要求4所述的兼容多荧光信号平台的农作物品种基因型分型方法,其特征在于,所述基于各所述最优聚类簇,确定各所述位点分别对应的所述第二标记特征,包括:将各所述最优聚类簇的聚类中心分别与除自身之外的最优聚类簇的聚类中心进行距离计算,得到至少一个距离值;基于各所述距离值,确定至少一个目标最优聚类簇;<...

【专利技术属性】
技术研发人员:王凤格赵怡锟王蕊张云龙
申请(专利权)人:北京市农林科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1