一种多样本间甲基化差异检测方法及装置制造方法及图纸

技术编号:8453193 阅读:253 留言:0更新日期:2013-03-21 18:05
本发明专利技术提供了一种多样本间甲基化差异的检测方法,该方法包括步骤:获得多组样本的基因组测序片段对应于参考基因组序列上的位置信息以及各个样本的甲基化数据;对在参考基因组序列上滑动的同一判断区间内的各组的甲基化数据进行分析,获取上述组基因组上存在甲基化差异的甲基化差异区域;对同一甲基化差异区域内的各组的甲基化数据进行分析,获取在甲基化差异区域内存在甲基化差异的具体组。本发明专利技术还提供了一种多样本间甲基化差异的检测装置。本发明专利技术的多样本间甲基化差异的检测方法及装置能查找并检测出多个样本基因组之间存在的甲基化差异性区域以及在该甲基化差异性区域存在甲基化差异的样本组。

【技术实现步骤摘要】

本专利技术涉及表观遗传学领域,特别是涉及一种多样本间甲基化差异检测方法及装置
技术介绍
DNA甲基化已经成为表观遗传学和表观基因组学的重要研究内容。DNA甲基化是重要的表观遗传调控因子之一,对不同细胞、组织等甲基化修饰模式差异的研究,对于更好地解释组织与组织之间、个体与个体之间在表观修饰上存在差异的原因以及对于疾病易感人群,个体医疗甚至药物设计等方面的研究有着重大的意义。然而,相对于测定DNA甲基化谱的高通量实验技术的快速发展,从这些实验数据中查找与检测甲基化显著性差异区域的方法和装置的步伐却远远滞后。目前已实现的甲基化显著性差异区域检测的方法,主要集中在两个样本之间的比较,例如,利用卡方检验或者t检验获得显著性差异区间,这种方法在一定程度上可以获得具有差异的区间,但是由于灵敏度较低,统计功效不高,不能实现多样本间甲基化显著性差异区域的查找与检测。另外就是利用基因芯片技术,但该技术具有检测结果不准确、实验要求闻、费用昂贵的缺点。因此,研究一种新的可以进行多样本间甲基化差异区域查找和甲基化差异检测并且具有较高灵敏度、特异度、准确性高,成本低的技术就成了亟待解决的问题。
技术实现思路
本专利技术主要解决的技术问题是提供一种多样本间甲基化差异检测方法及装置,能够准确、灵敏、快速地进行多样本间甲基化差异检测。为解决上述技术问题,本专利技术采用的一个技术方案是本专利技术提供了一种多样本间甲基化差异的检测方法,该方法包括步骤获得多组样本的基因组测序片段对应于参考基因组序列上的位置信息以及各个样本的甲基化数据;对在参考基因组序列上滑动的同一判断区间内的各组的甲基化数据进行分析,获取上述组基因组上存在甲基化差异的甲基化差异区域;对同一甲基化差异区域内的各组的甲基化数据进行分析,获取在甲基化差异区域内存在甲基化差异的具体组。根据本专利技术的一优选实施例,对在参考基因组序列上滑动的同一判断区间内的各组的甲基化数据进行分析,获取上述组基因组上存在甲基化差异的甲基化差异区域的步骤包括以下步骤预设窗口长度,根据位置信息,从参考基因组序列起始端开始,以窗口长度作为判断区间的起始长度在参考基因组序列上设定判断区间;判断同一判断区间内的各组的甲基化数据是否符合方差分析前提;若符合方差分析前提,则将位置在同一判断区间内的各组的甲基化数据进行组间方差分析,若不符合方差分析前提,则将位置在同一判断区间内的各组的甲基化数据进行组间Kruskal-Wallis非参数检验,得到分析结果,根据分析结果判断上述组在该判断区间内是否存在甲基化差异;若存在甲基化差异,则延长该判断区间,判断位置在同一延长后的判断区间内的各组的甲基化数据是否符合方差分析前提,若符合则进行前述组间方差分析,若不符合则进行前述组间Kruskal-Wallis非参数检验,得到分析结果,并根据分析结果判断上述组在当前判断区间内是否存在甲基化差异的步骤,重复本步骤直至判断得出上述组在当前判断区间内不存在甲基化差异,并输出该当前判断区间的信息作为甲基化差异区域;若不存在甲基化差异,则从上一判断区间的末端开始在参考基因组序列上以窗口长度作为判断区间的起始长度设定下一判断区间,判断位置在同一判断区间内的各组的甲基化数据是否符合方差分析前提,若符合则进行前述组间方差分析,若不符合则进行前述组间Kruskal-Wallis非参数检验,得到分析结果,并根据分析结果判断上述组在该判断区间内是否存在甲基化差异,若存在甲基化差异则执行前述延长该判断区间、判断是否符合方差分析前提以及分析并判断上述组在当前判断区间内是否存在甲基化差异的步骤,若不存在甲基化差异则执行本步骤。根据本专利技术的一优选实施例,的对同一甲基化差异区域内的各组的甲基化数据进行分析,获取在甲基化差异区域内存在甲基化差异的具体组的步骤包括以下步骤通过最小显著性差异法对位置在同一甲基化差异区域内的且符合方差分析前提的各组的甲基化数据进行组间两两比较,通过Kruskal-Wallis Dunn方法对各组在甲基化差异区域内的且不符合方差分析前提的甲基化数据进行组间两两比较,得到比较结果;根据比较结果判断并输出在该甲基化差异区域内存在甲基化差异的具体组。根据本专利技术的一优选实施例,对在参考基因组序列上滑动的同一判断区间内的各组的甲基化数据进行分析,获取上述组基因组上存在甲基化差异的甲基化差异区域的步骤包括以下步骤在判断完上述组在当前判断区间是否存在甲基化差异之后,判断当前判断区间是否已达参考基因组序列末端,若是,则终止继续设定或延长判断区间以及分析并判断上述组在判断区间内是否存在甲基化差异的步骤。根据本专利技术的一优选实施例,在判断得出上述组在当前判断区间内存在甲基化差异时,延长该判断区间的步骤具体为将该判断区间延长一个预设步长。根据本专利技术的一优选实施例,方差分析前提为各组样本的数据是否具有独立性;同一判断区间内的各组的甲基化数据是否符合正态分布;同一判断区间内的各组的甲基化数据是否符合方差齐性。本专利技术还提供了一种多样本间甲基化差异的检测装置,该装置包括甲基化数据获取单元,用于获得多组样本的基因组测序片段对应于参考基因组序列上的位置信息以及各个样本的甲基化数据;甲基化差异区域获取单元,用于对在参考基因组序列上滑动的同一判断区间内的各组的甲基化数据进行分析,获取上述组基因组上存在甲基化差异的甲基化差异区域;甲基化差异组获取单元,用于对同一甲基化差异区域内的各组的甲基化数据进行分析,获取在甲基化差异区域内存在甲基化差异的具体组。根据本专利技术的一优选实施例,甲基化差异区域获取单元包括设置单元,用于预设窗口长度,根据位置信息,从参考基因组序列起始端开始,以窗口长度作为判断区间的起始长度在参考基因组序列上设定判断区间;判断单元,用于判断同一判断区间内的各组的甲基化数据是否符合方差分析前提;分析单元,若符合方差分析前提,分析单元用于将位置在同一判断区间内的各组的甲基化数据进行组间方差分析,若不符合方差分析前提,分析单元用于将位置在同一判断区间内的各组的甲基化数据进行组间Kruskal-Wallis非参数检验,得到分析结果,并根据分析结果判断上述组在该判断区间内是否存在甲基化差异;控制单元,若存在甲基化差异,控制单元控制设置单元延长该判断区间,控制判断单元判断位置在同一延长后的判断区间内的各组的甲基化数据是否符合方差分析前提,控制分析单元在符合方差分析前提时进行前述组间方差分析,在不符合方差分析前提时进行前述组间Kruskal-Wallis非参数检验,得到分析结果,并根据分析结果判断上述组在当前判断区间内是否存在甲基化差异的步骤,控制设置单元、判断单元及分析单元重复本步骤直至判断得出上述组在当前判断区间内不存在甲基化差异,并输出该当前判断区间的信息作为甲基化差异区域;若不存在甲基化差异,控制单元控制设置单元从上一判断区间的末端开始在参考基因组序列上以窗口长度作为判断区间的起始长度设定下一判断区间,控制判断单元判断位置在同一判断区间内的各组的甲基化数据是否符合方差分析前提,控制分析单元在符合方差分析前提时进行前述组间方差分析,控制分析单元在不符合方差分析前提时进行前述组间Kruskal-Wallis非参数检验,得到分析结果,并根据分析结果判断上述组在该判断区间内是否存在甲基化本文档来自技高网...

【技术保护点】
一种多样本间甲基化差异的检测方法,其特征在于,所述方法包括步骤:获得多组样本的基因组测序片段对应于参考基因组序列上的位置信息以及各个样本的甲基化数据;对在所述参考基因组序列上滑动的同一判断区间内的各组的所述甲基化数据进行分析,获取上述组基因组上存在甲基化差异的甲基化差异区域;对同一甲基化差异区域内的各组的所述甲基化数据进行分析,获取在所述甲基化差异区域内存在甲基化差异的具体组。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴红龙黄树嘉王俊
申请(专利权)人:深圳华大基因科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1