基于细胞游离DNA的深度测序数据提取生物标记物的方法和装置制造方法及图纸

技术编号:17940015 阅读:115 留言:0更新日期:2018-05-15 20:21
提供一种基于细胞游离DNA的深度测序数据提取生物标记物的方法和装置。方法包括由处理器执行的如下步骤:获取不同类别的样本的细胞游离DNA的深度测序数据;计算每个样本数据在每个碱基位置的各变异的频率值;基于所计算的每个碱基位置的各变异的频率值,得到每个类别在所有碱基位置上的变异的频率分布;确定频率分布在类别间具有充分差异的变异;以及基于所确定的变异提取所述生物标记物。该方法可以极大限度地挖掘cfDNA数据中的信息。

Method and device for extracting biomarkers based on deep sequencing data of cell free DNA

A method and device for extracting biomarkers based on deep sequencing data of cell free DNA are provided. The method includes the following steps performed by the processor: obtaining the depth sequencing data of the cell free DNA of different categories of samples; calculating the frequency values of each variation of each sample data at each base position; based on the frequency values of each variation of each base position calculated, each category is located at all base positions. The frequency distribution of variation; the variation of frequency distribution between categories is determined; and the biomarkers are extracted based on the determined variation. This method can excavate the information in cfDNA data to a great extent.

【技术实现步骤摘要】
基于细胞游离DNA的深度测序数据提取生物标记物的方法和装置
本专利技术涉及分子生物学
,具体涉及基于细胞游离DNA的深度测序数据提取生物标记物的方法以及装置。
技术介绍
人类的疾病直接或间接与基因有关(文中又称此种类型的疾病为基因疾病),如所有的遗传病,都是由于基因结构异常或基因表达异常所引起的;有些疾病则是环境因素与遗传因素综合作用的结果,如吸烟引起肺癌。基因异常所致疾病(即,基因疾病)大致分为以下三类:1.单基因病:在一个基因位点上存在缺陷,如镰刀红细胞贫血。2.多基因病:涉及一个以上的基因以及基因与环境因素的相互作用,如肿瘤、心血管病、代谢性疾病、神经和精神类疾病、免疫性疾病等。3.获得性基因病:这类疾病由病原微生物感染引起,不符合孟德尔遗传规律,但可发生病原微生物基因组与人类基因组的相互作用,这类疾病多数涉及人类基因组结构及表达功能的改变,如爱滋病、鼻咽癌等。cfDNA、ctDNA和CTC的检测作为当前比较热门的液体活检的手段,可应用于疾病的诊断。其中,cfDNA(cell-freeDNA,细胞游离DNA),即血液或其他体液中游离的DNA片段。在基因病,例如肿瘤的发展过本文档来自技高网...
基于细胞游离DNA的深度测序数据提取生物标记物的方法和装置

【技术保护点】
一种基于细胞游离DNA的深度测序数据提取生物标记物的方法,所述方法由计算机实现,包括由处理器执行的如下步骤:获取不同类别的样本的细胞游离DNA的深度测序数据;计算每个样本数据在每个碱基位置的各变异的频率值;基于所计算的每个碱基位置的各变异的频率值,得到每个类别在碱基位置上的变异的频率分布;确定频率分布在类别间具有充分差异的变异;以及基于所确定的变异提取所述生物标记物。

【技术特征摘要】
1.一种基于细胞游离DNA的深度测序数据提取生物标记物的方法,所述方法由计算机实现,包括由处理器执行的如下步骤:获取不同类别的样本的细胞游离DNA的深度测序数据;计算每个样本数据在每个碱基位置的各变异的频率值;基于所计算的每个碱基位置的各变异的频率值,得到每个类别在碱基位置上的变异的频率分布;确定频率分布在类别间具有充分差异的变异;以及基于所确定的变异提取所述生物标记物。2.根据权利要求1所述的方法,其特征在于,所述样本为体液样本。3.根据权利要求1所述的方法,其特征在于,基于所确定的变异提取所述生物标记物的步骤包括:提取所确定的变异所在碱基位置的所有变异的频率分布,作为所述生物标记物。4.根据权利要求1所述的方法,其特征在于,基于所确定的变异提取所述生物标记物的步骤包括:提取所确定的变异的频率分布,作为所述生物标记物。5.根据权利要求1所述的方法,其特征在于,确定频率分布在类别间具有充分差异的变异的步骤包括:计算变异的频率分布在不同类别之间的差异程度;在所述变异的差异程度满足预定条件的情况下,认为所述变异的频率分布在类别间具有充分差异。6.根据权利要求5所述的方法,其中:所述差异程度包括频率分布的距离,所述预定条件包括:所述频率分布的距离大于第一预定阈值。7.根据权利要求5所述的方法,其中:所述差异程度包括P值,所述预定条件包括:所述P值小于第二预定阈值。8.根据权利要求1所述的方法,其中:所述碱基位置为靶向区域中的碱基位置。9.根据权利要求1~8中任一项所述的方法,其中:所述变异包括如下类型中的一种或更多种:单核苷酸变异类型、插入变异类型、删除变异类型。10.根据权利要求1~8中任一项所述的方法,其中:所述类别为肿瘤类别、关于预后的类别、与关于治疗反应的类别中的任何一个类别。11.一种基于细胞游离DNA的深度测序数据提取生物标记物的装置,包括:样本数据获取模块,其配置为获取不同类别的样本的细胞游离DNA的深度测序数据;频率值计算模块...

【专利技术属性】
技术研发人员:万季宋麒潘有东崔好韩艳高峰
申请(专利权)人:深圳市新合生物医疗科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1