本发明专利技术创造提供了一种单细胞外显子测序肿瘤体细胞突变检测及分析平台,包括假阳性分析模块、等位基因丢失率分析模块、过滤体细胞突变模块和体细胞突变筛选模块、单细胞异质性分析模块;所述假阳性分析模块、等位基因丢失率分析模块与过滤筛选体细胞突变模块连接,所述过滤筛选体细胞突变模块与所述单细胞异质性分析模块连接。本发明专利技术通过对单细胞突变位点假阳性率、等位基因丢失率的计算,过滤肿瘤中的体细胞突变,并分析单细胞之间的异质性,本发明专利技术根据单细胞基因组突变的假阳性情况论证测序结果的可靠性,能够检测单细胞实验技术的可靠性,能够对后续结果进行多功能分析。
【技术实现步骤摘要】
本专利技术创造属于基因测序领域,尤其是涉及一种单细胞外显子测序肿瘤体细胞突变检测及分析平台。
技术介绍
在过去的基因组学研究中我们只能关注一块组织整体的基因组情况,但是成千上万个细胞混在一起进行研究,会模糊我们对大脑、血液系统、免疫系统,及其组成这些系统的细胞之间异质性(heterogeneity)的认识。可对于每个细胞的基因组情况的研究进展缓慢,这是由于一个细胞里的DNA仅仅处在皮克(picograms)级的水平,这么少的量远远达不到现有测序仪的最低上样需求。从2013年至今,多种单细胞测序扩增技术(例如:多重置换扩增技术MDA、多重退火环状扩增循环技术MALBAC)的逐渐完善得以让我们对一个细胞的基因组进行系统的分析。通过单细胞扩增技术结合已有的外显子测序,深入到一个肿瘤细胞的层面进行疾病的致病变异检测,挖掘不同细胞间的关系是今后的一个热点方向。在此基础上的体细胞突变分析的设计是一个非常关键的问题。现有的突变检测系统可以检测到所有样本中的突变位点,但是这些位点的可靠性分析却很少针对单细胞数据进行优化。在单细胞突变位点检测中主要面对的两个问题,一个是假阳性结果,另一个是等位基因丢失。假阳性结果是指在组织混合测序中无法检测到的位点,在单细胞中确检测到了,这种结果可能是由于测序时的误差导致。等位基因丢失是在单细胞扩增时只对于等位基因中的一条进行了扩增,对另一条没有扩增,从而导致一个突变位点的纯合、杂合情况改变。根据不同数据的假阳性和等位基因丢失情况,单细胞突变结果的筛选条件要适当变化,以确保其准确性。为此,我们设计开发了单细胞外显子测序肿瘤体细胞突变检测平台,根据MuTect提供的体细胞突变结果和GATK的突变检测结果,着重分析单细胞突变位点的假阳性、等位基因丢失率,采用针对单细胞的筛选条件过滤肿瘤中的体细胞突变。
技术实现思路
有鉴于此,本专利技术创造旨在提出一种单细胞外显子测序肿瘤体细胞突变检测及分析平台,以实现获得高可靠性的体细胞突变。为达到上述目的,本专利技术创造的技术方案是这样实现的:一种单细胞外显子测序肿瘤体细胞突变检测及分析平台,包括假阳性分析模块,用于计算单细胞基因组突变的假阳性率,单细胞假阳性越高,突变位点的可靠性越低;等位基因丢失率分析模块,用于计算单细胞基因组突变的等位基因丢失率,等位基因丢失率越高,突变位点的可靠性越低;过滤筛选体细胞突变模块,用于过滤肿瘤中的体细胞突变,并根据假阳性率、等位基因丢失率筛选可信度高的体细胞突变;单细胞异质性分析模块,用于分析单细胞的组内异质性;所述假阳性分析模块、等位基因丢失率分析模块与过滤筛选体细胞突变模块连接,所述过滤筛选体细胞突变模块与所述单细胞异质性分析模块连接。进一步的,所述等位基因丢失率分析模块包括杂合性突变位点检测模块、纯合性突变位点检测模块。进一步的,所述过滤筛选体细胞突变模块包括条件判断模块、Fisher精确性检验模块。进一步的,所述单细胞异质性分析模块包括雅克比距离计算模块、主成分分析模块。相对于现有技术,本专利技术创造所述的一种单细胞外显子测序肿瘤体细胞突变检测及分析平台具有以下优势:本专利技术创造首先根据单细胞基因组突变的假阳性情况论证测序结果的可靠性。单细胞测序由于技术的有限性,通常都会比组织测序结果的假阳性高。我们已知整体数据的假阳性越高,突变位点的可靠性越低,需要综合多个细胞的结果来筛选可靠的体细胞突变位点。现有的突变检测平台可以检测到所有样本中的突变位点,但不提供假阳性情况的分析,无法掌握数据的整体质量情况。其次,本专利技术能够检测单细胞实验技术的可靠性,在单细胞扩增时等位基因丢失会导致突变位点的基因型(纯合、杂合)发生改变,这会导致将一些杂合性突变误判成纯合性突变,造成对突变危害的误判。第三,体细胞突变在所有突变中的比例较少,在单细胞中由于每个样本的测序数据量比组织测序要小,精筛时要通过假设检验来排除不可信的位点。并根据假阳性和等位基因丢失率来确定在几个单细胞重复中出现的体细胞突变是可靠的体细胞突变。在单细胞包个数较少的情况下,默认突变位点至少要在2个细胞中重复出现。最后对于多组织单细胞数据的进行异质性分析,本专利技术不仅能够筛选体细胞突变,而是能够对后续研究分析结果进行一定的多功能分析。附图说明构成本专利技术创造的一部分的附图用来提供对本专利技术创造的进一步理解,本专利技术创造的示意性实施例及其说明用于解释本专利技术创造,并不构成对本专利技术创造的不当限定。在附图中:图1为本专利技术创造实施例所述的一种单细胞外显子测序肿瘤体细胞突变检测及分析平台的结构示意图;图2为本专利技术实施例所述的不同组织样本中单细胞的假阳性率;图3为本专利技术实施例所述的不同组织样本中单细胞的等位基因丢失率;图4为本专利技术实施例所述的每个样本中单细胞同义突变以及非同义突变的数目;图5为本专利技术实施例所述的不同组织样本中单细胞间的基因型距离分布图;图6为本专利技术实施例所述的不同组织样本中单细胞间PCA分析结果图。具体实施方式需要说明的是,在不冲突的情况下,本专利技术创造中的实施例及实施例中的特征可以相互组合。在本专利技术创造的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术创造和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术创造的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术创造的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本专利技术创造的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本专利技术创造中的具体含义。下面将参考附图并结合实施例来详细说明本专利技术创造。如图1所示,一种单细胞外显子测序肿瘤体细胞突变检测及分析平台,包括假阳性分析模块,用于计算单细胞基因组突变的假阳性率,首先定义在组织测序和单细胞测序中都发现的突变为真阳性突变(TP mutation),在组织测序中发现但是在单细胞中没有发现的突变是假阴性突变(FN mutation),在单细胞中发现但是没有在组织测序中发现的突变是假阳性突变(FP mutation),在组织测序中没有被识别成突变的位点为真阳性突变(TN mutation),根据上述数据计算假阳性率FPR=FP/(FP+TN)单细胞假阳性越高,突变位点的可靠性越低;假阳性分析模块对应的程序为:FDR_calculator.R:过滤GATK输出的变异vcf提取readsdepth信息,计算单细胞数据的假阳性,输出每个分组中的假阳性比例,以及pdf格式图片;FDR_calculator.R用来对样本突变进行假阳性分析,本文档来自技高网...
【技术保护点】
一种单细胞外显子测序肿瘤体细胞突变检测及分析平台,其特征在于:包括假阳性分析模块,用于计算单细胞基因组突变的假阳性率,单细胞假阳性越高,突变位点的可靠性越低;等位基因丢失率分析模块,用于计算单细胞基因组突变的等位基因丢失率,等位基因丢失率越高,突变位点的可靠性越低;过滤筛选体细胞突变模块,用于过滤筛选肿瘤中的体细胞突变,并根据假阳性率、等位基因丢失率筛选可信度高的体细胞突变;单细胞异质性分析模块,用于分析单细胞的组内异质性;所述假阳性分析模块、等位基因丢失率分析模块与过滤筛选体细胞突变模块连接,所述过滤筛选体细胞突变模块与所述单细胞异质性分析模块连接。
【技术特征摘要】
1.一种单细胞外显子测序肿瘤体细胞突变检测及分析平台,其特征在于:包括假阳性分析模块,用于计算单细胞基因组突变的假阳性率,单细胞假阳性越高,突变位点的可靠性越低;等位基因丢失率分析模块,用于计算单细胞基因组突变的等位基因丢失率,等位基因丢失率越高,突变位点的可靠性越低;过滤筛选体细胞突变模块,用于过滤筛选肿瘤中的体细胞突变,并根据假阳性率、等位基因丢失率筛选可信度高的体细胞突变;单细胞异质性分析模块,用于分析单细胞的组内异质性;所述假阳性分析模块、等位基因丢失率分析模块与过滤筛选体细胞突变模块连接,所述过滤筛选...
【专利技术属性】
技术研发人员:薛成海,李阳,张广发,
申请(专利权)人:万康源天津基因科技有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。