基于测序数据分析染色体核型的方法、装置及存储介质制造方法及图纸

技术编号:44972003 阅读:32 留言:0更新日期:2025-04-12 01:46
本发明专利技术公开了一种基于测序数据分析染色体核型的方法、装置及存储介质,涉及生物信息学技术领域。其中,该方法包括:对高通量测序获得的测序数据进行质控和纠错,得到待分析基因序列数据;对待分析基因序列数据进行端粒查询和筛选,筛选出带端粒序列;对带端粒序列进行位置过滤、固定端对齐、端粒序列裁剪和区间化取值,得到固定长度的基因片段;将固定长度的基因片段两两排列组合,并进行全局比对,获得全局比对结果;基于全局比对结果进行相似性评分,构建全局比对得分矩阵;对全局比对得分矩阵进行相似性聚类分析,识别出所对应的物种的染色体核型信息。通过本发明专利技术,可利用高通量测序数据分析物种染色体核型,不受研究物种的限制。

【技术实现步骤摘要】

本专利技术涉及生物信息学,尤其涉及一种基于测序数据分析染色体核型的方法、装置及存储介质


技术介绍

1、随着科学技术的发展,染色体核型分析已经从传统的显微镜观察,逐步结合高通量组学数据,推动了染色体研究从形态学向分子层面深入。目前,染色体分析与基因组数据整合难度大,染色体核型分析主要关注宏观染色体结构和行为,而生物信息学通常处理精细的基因序列或基因组数据。如何高效整合大尺度(染色体级别)与小尺度(基因、核苷酸级别)信息仍是挑战。异质性数据的标准化不足,样本来源、技术手段(如显带技术、fish、全基因组测序)和分析平台的多样性导致数据难以统一,影响结果的比较和复用。算法准确性与效率权衡,生物信息学算法往往需要在高分辨率分析和计算率之间找到平衡点,但这在超大染色体数据集(如高通量测序数据)中表现困难。高噪声数据的处理能力不足,染色体数据通常包含实验噪声(如显带图像伪影、测序错误等),现有生物信息学方法在去噪和准确识别异常方面的能力有限。

2、随着高通量测序数据的发展,在生物信息学领域,人们渴望开发基于生物信息学手段进行染色体核型分析的方法,而目前,本文档来自技高网...

【技术保护点】

1.一种基于测序数据分析染色体核型的方法,其特征在于,包括:

2.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,对高通量测序获得的测序数据进行质控和纠错包括:

3.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,对所述待分析基因序列进行端粒查询和筛选,筛选出带端粒序列包括:

4.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,对所述带端粒序列进行位置过滤、固定端对齐、端粒序列裁剪和区间化取值,得到固定长度的基因片段包括:

5.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征...

【技术特征摘要】

1.一种基于测序数据分析染色体核型的方法,其特征在于,包括:

2.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,对高通量测序获得的测序数据进行质控和纠错包括:

3.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,对所述待分析基因序列进行端粒查询和筛选,筛选出带端粒序列包括:

4.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,对所述带端粒序列进行位置过滤、固定端对齐、端粒序列裁剪和区间化取值,得到固定长度的基因片段包括:

5.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,将所述固定长度的基因片段两两排列组合,并进行全局比对,获得全局比对结果包括:

6.根据权利要求1所述的基于测序数据分析染色体核型的方法,其特征在于,基于所述全...

【专利技术属性】
技术研发人员:肖世俊刘飞彭美
申请(专利权)人:西藏自治区农牧科学院水产科学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1