一种用于乳腺癌发病风险预测的多因素模型及其建立方法技术

技术编号:16288189 阅读:53 留言:0更新日期:2017-09-26 07:55
本发明专利技术公开了一种用于乳腺癌发病风险预测的多因素模型及其建立方法,该多因素模型的建立方法包括对基因检测的筛查,筛查包括步骤:(1)外周血样本的收集及处理;(2)构建样本的文库DNA,并采用Hiseq测序平台进行上机测序;(3)对下机数据进行生物信息分析,找出致病突变;(4)采用金标准Sanger测序技术对突变位点进行测序,获得准确基因突变信息。本发明专利技术方法建立的用于乳腺癌发病风险预测的多因素模型,能对这部分人群进行早期筛查、早期诊断,采取积极的干预措施,特别适用于家族性乳腺癌高危人群预测。

Multi factor model for predicting breast cancer risk and method for establishing the same

The invention discloses a multi factor model for breast cancer risk prediction and its establishment method, method of establishing the multi factor model including screening for genetic testing, screening includes the steps of: (1) the collection and treatment of peripheral blood samples; (2) DNA library constructed samples, and using Hiseq sequencing platform computer sequencing; (3) the biological information analysis of data, find the causative mutation; (4) were sequenced for mutations using gold standard Sanger sequencing technology, to obtain accurate information of gene mutation. For the multi factor model for breast cancer risk prediction is established by the method of the invention, the diagnosis can be early screening, early on this part of the crowd, take positive measures, especially suitable for familial breast cancer high-risk population forecast.

【技术实现步骤摘要】

本专利技术涉及乳腺癌的发病风险评估领域,具体涉及一种采用多种高危因素结合胚系基因突变构建的用于乳腺癌发病风险预测的多因素模型及其建立方法,特别适用于家族性乳腺癌高危人群预测。
技术介绍
乳腺癌是女性最常见恶性肿瘤之一。2014年中国肿瘤登记年报数据显示,2012年中国乳腺癌发病率达42.55/10万,并以每年2-3%的速度增加,城市地区尤为明显。月经初潮年龄早、绝经年龄晚、不孕、营养过剩、肥胖、饮食、乳腺癌家族史等危险因素与乳腺癌发病有关。而家族史是最确定的乳腺癌高危因素之一,家族性乳腺癌在整个乳腺癌人群中占相当大的比例。如果能对这部分人群进行早期筛查、早期诊断,采取积极的干预措施,对降低我国乳腺癌发病率和提高这部分人群术后生存率,具有重要意义。国外在10年前就开始研究评估家族性乳腺癌发病风险的模型,并且先后开发出了以Gail、Claus、Cuzick-tyrer、BRCAPPO和Myriad等模型。Gail及Claus模型是在西方应用较为广泛的风险评估模型。缺点是该模型在亚洲女性人群中的应用效果仍缺乏相关证据。Cuzick-tyrer、BRCAPPO和Myriad模型尽管结合了相关高危因素及BRCA基因突变检测,但这些模型建立的数据是主要来源于北美和欧洲人群。因此这些模型对中国人群的基因风险评估意义值得探讨。
技术实现思路
本专利技术为解决现有技术中的上述问题,提出一种采用多种高危因素结合胚系基因突变构建的用于乳腺癌发病风险预测的多因素模型及其建立方法。为实现上述目的,本专利技术采用以下技术方案:本专利技术的第一个方面是提供一种用于乳腺癌发病风险预测的多因素模型的建立方法,包括对基因检测的筛查,所述筛查具体包括如下步骤:(1)外周血样本的收集及处理;(2)构建样本的文库DNA,并采用Hiseq测序平台进行上机测序,保证每个文库的原始的数据量达到0.6Gb以上,目标区域的平均测序深度为200X,目标区域覆盖度达99%以上;(3)对下机数据进行生物信息分析找到样本中的点突变和插入/缺失突变,并对目标区域的乳腺癌易感基因突变进行解读,找出致病突变;(4)采用金标准Sanger测序技术对突变位点进行测序,根据测序峰图分析目标位点的突变情况,验证高通量测序所获突变位点的准确性,获得准确基因突变信息。进一步地,所述步骤(1)中外周血样本的收集及处理的具体方法为:每个受试者使用EDTA抗凝管收集约5ml静脉血,上下混匀,经DNA提取试剂盒DNABloodminikit提取样本中基因组DNA200ul,使用2.0检测DNA浓度,每份样本的DNA获得量≥2μg。进一步地,所述步骤(2)中构建样本文库DNA的具体方法为:基因组DNA经随机打断、纯化、末端修复加A后,与Hiseq测序所需特殊接头连接,然后经PCR预扩增,乳腺癌易感基因芯片目标区域靶向杂交捕获和PCR再扩增后,得到目标区域DNA的hiseq上机文库。进一步地,所述步骤(3)中对下机数据进行生物信息分析的具体方法为:对原始测序数据进行初步处理和质量控制,将所得序列用BWA软件比对到人的参考基因组Hg19上,经Picard和GATK软件去重,校正和突变检测后,找到样本中的点突变和插入/缺失突变。进一步地,所述步骤(4)中采用金标准Sanger测序技术对突变位点进行测序的具体方法为:首先,对该突变位点所在的区域设计引物进行PCR扩增,然后以提取的基因组DNA为模板,使用设计的引物进行PCR扩增,扩增的条件为:95℃预变性3min;94℃变性25sec,57℃退火30sec,72℃延伸40sec,30个循环;最后72℃充分延伸8min;40ul扩增的体系为:2XKapa2GRobustHotStartReadyMix20ul,引物F和R各2ul(10uM),DNA模板1ul(50ng/ul)后,最后加双蒸水补至40ul;PCR产物经琼脂糖凝胶电泳验证后,进行PCR产物纯化及测序。进一步地,还包括对常规高危因素的筛选:以乳腺癌家族史的发病人群及未患病人群为受试人群,确定受试者的肿瘤家族史、乳腺良性疾病史、月经史、初潮史、是否绝经、流产史、母乳喂养史、钼靶照射史、是否服用雌激素类药物。进一步优选地,还包括对上述基因检测的筛查和常规高危因素的筛选两部分进行数据统计分析,建立用于乳腺癌发病风险预测的多因素模型,包括:先单因素分析筛选到有统计学意义的乳腺癌危险因素:分别为家族史,乳腺良性疾病史,怀孕史,乳腺钼靶照射史,及ATM、BRCA2、BRIP1基因突变;再根据Logistic回归分析,最终得到预测乳腺癌发病风险模型:Y=1.614+0.764X1+0.324X2-1.699X3-1.970X4+1.619X5其中,X1=家族史,X2=乳腺良性疾病史,X3=怀孕史,X4=乳腺钼靶照射史,X5=BRCA基因突变Y=乳腺癌发病风险。本专利技术的第二个方面是提供一采用上述方法建立的种用于乳腺癌发病风险预测的多因素模型,所述多因素模型为:Y=1.614+0.764X1+0.324X2-1.699X3-1.970X4+1.619X5其中,X1=家族史,X2=乳腺良性疾病史,X3=怀孕史,X4=乳腺钼靶照射史,X5=BRCA基因突变Y=乳腺癌发病风险。本专利技术的第三个方面是提供一种用于样本收集的抗凝管,其包括管体,管体包括粗管和细管两部分,粗管与细管之间平滑过渡连接,粗管的管口处设置有密封盖,密封盖的中央设置有一个可直接在采血点采血的取血管,该取血管穿过密封盖伸入细管的内腔中。进一步地,在用于样本收集的抗凝管中,所述细管的内腔为横截面呈三星形或椭圆形的腔体。本专利技术采用上述技术方案,与现有技术相比,具有如下技术效果:本专利技术用于乳腺癌发病风险预测的多因素模型,采用多种高危因素结合胚系基因突变构建,其主要由常规高危因素和基因突变因素两大部分构成,通过对单因素分析筛选到有统计学意义的乳腺癌危险因素进行数据统计,再根据Logistic回归分析;该用于乳腺癌发病风险预测的多因素模型,能对这部分人群进行早期筛查、早期诊断,采取积极的干预措施,特别适用于家族性乳腺癌高危人群预测,对降低我国乳腺癌发病率和提高这部分人群术后生存率,具有重要意义。附图说明图1为本专利技术一种用于乳腺癌发病风险预测的多因素模型的Logistic回归线性关系图;图2为本专利技术一种用于乳腺癌发病风险预测的多因素模型的建立流程图。具体实施方式下面通过具体实施例对本专利技术进行详细和具体的介绍,以使更好的理解本专利技术,但是下述实施例并不限制本专利技术范围。一种评估家族性乳腺癌发病风险的多因素预测模型主要有常规高危因素和基因突变因素两大部分构成。如图2所示,本专利技术实施例的评估家族性乳腺癌发病风险的多因素预测模型的建立方法包括以下步骤:(1)高危因素的筛选:选择乳腺癌家族史的发病人群及未患病人群进行随访调查研究。调查内容包括:肿瘤家族史,乳腺良性疾病史,月经史,初潮史,是否绝经,流产史,母乳喂养史,钼靶照射史,是否服用雌激素类药物等;受试人群获得知情同意之后,填写调查问卷,后期统计分析。(2)基因检测的筛查:(a)人全血DNA的提取每个受试者使用EDTA抗凝管收集约5ml静脉血,上下混匀,经DNA提取试剂盒DNABloodminikit提取样本中基因本文档来自技高网...
一种用于乳腺癌发病风险预测的多因素模型及其建立方法

【技术保护点】
一种用于乳腺癌发病风险预测的多因素模型的建立方法,其特征在于,包括对基因检测的筛查,所述筛查具体包括如下步骤:(1)样本的收集及处理;(2)构建样本的文库DNA,并采用Hiseq测序平台进行上机测序,保证每个文库的原始的数据量达到0.6Gb以上,目标区域的平均测序深度为200X,目标区域覆盖度达99%以上;(3)对下机数据进行生物信息分析找到样本中的点突变和插入/缺失突变,并对目标区域的乳腺癌易感基因突变进行解读,找出致病突变;(4)采用金标准Sanger测序技术对突变位点进行测序,根据测序峰图分析目标位点的突变情况,验证高通量测序所获突变位点的准确性,获得准确基因突变信息。

【技术特征摘要】
1.一种用于乳腺癌发病风险预测的多因素模型的建立方法,其特征在于,包括对基因检测的筛查,所述筛查具体包括如下步骤:(1)样本的收集及处理;(2)构建样本的文库DNA,并采用Hiseq测序平台进行上机测序,保证每个文库的原始的数据量达到0.6Gb以上,目标区域的平均测序深度为200X,目标区域覆盖度达99%以上;(3)对下机数据进行生物信息分析找到样本中的点突变和插入/缺失突变,并对目标区域的乳腺癌易感基因突变进行解读,找出致病突变;(4)采用金标准Sanger测序技术对突变位点进行测序,根据测序峰图分析目标位点的突变情况,验证高通量测序所获突变位点的准确性,获得准确基因突变信息。2.根据权利要求1所述多因素模型的建立方法,其特征在于,所述步骤(1)中样本的收集及处理的具体方法为:每个受试者使用EDTA抗凝管收集约5ml静脉血,上下混匀,经DNA提取试剂盒DNABloodminikit提取样本中基因组DNA200ul,使用2.0检测DNA浓度,每份样本的DNA获得量≥2μg。3.根据权利要求1所述多因素模型的建立方法,其特征在于,所述步骤(2)中构建样本文库DNA的具体方法为:基因组DNA经随机打断、纯化、末端修复加A后,与Hiseq测序所需特殊接头连接,然后经PCR预扩增,乳腺癌易感基因芯片目标区域靶向杂交捕获和PCR再扩增后,得到目标区域DNA的hiseq上机文库。4.根据权利要求1所述多因素模型的建立方法,其特征在于,所述步骤(3)中对下机数据进行生物信息分析的具体方法为:对原始测序数据进行初步处理和质量控制,将所得序列用BWA软件比对到人的参考基因组Hg19上,经Picard和GATK软件去重,校正和突变检测后,找到样本中的点突变和插入/缺失突变。5.根据权利要求1所述多因素模型的建立方法,其特征在于,所述步骤(4)中采用金标准Sanger测序技术对突变位点进行测序的具体方法为:首先,对该突变位点所在的区域设计引物进行PCR扩增,然后以提取的基因组DNA为模板,使用设计的引物进行PCR扩增,扩增的条件为:95℃预变性3min;94℃变性25sec,57℃退火30se...

【专利技术属性】
技术研发人员:王先明简文静肖瑜刘维湘
申请(专利权)人:深圳市第二人民医院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1