一种粪便基因标志物的筛选及应用制造技术

技术编号:20922036 阅读:34 留言:0更新日期:2019-04-20 10:52
本发明专利技术涉及生物医学领域,尤其涉及到一种基于高通量宏基因组学测序分析的粪便基因标志物的筛选及应用。本发明专利技术通过提取粪便DNA使用鸟枪法进行宏基因组学测序和ROC曲线分析,筛选出基因标志物,并通过荧光实时定量PCR验证基因标志物获得其一致性。本发明专利技术首次在中国PD患者粪便中进行宏基因组高通量鸟枪测序技术测定,建立粪便基因标志物的筛选方法,发现PD患者粪便中众多差异基因,从中筛选出25个粪便基因标志物,可作为PD诊断标志物,用于PD患者的辅助诊断,对于丰富和深入了解PD的病理机制等,具有重要的学术意义和应用前景。

Screening and Application of a Fecal Gene Marker

The invention relates to the field of biomedicine, in particular to the screening and application of fecal gene markers based on high throughput macrogenomic sequencing analysis. The method extracts fecal DNA, uses bird gun method to sequence macrogenomics and ROC curve analysis, screens out gene markers, and verifies the consistency of gene markers by real-time fluorescence quantitative PCR. The present invention is the first time to carry out macrogenomic high-throughput bird-gun sequencing in the feces of PD patients in China, and to establish a screening method for fecal gene markers. It finds many different genes in the feces of PD patients, and screens out 25 fecal gene markers, which can be used as diagnostic markers for PD patients, and can be used for assistant diagnosis of PD patients. It is of great importance to enrich and deeply understand the pathological mechanism of PD. It has important academic significance and application prospects.

【技术实现步骤摘要】
一种粪便基因标志物的筛选及应用
本专利技术涉及生物医学领域,尤其涉及到一种基于高通量宏基因组学测序分析的粪便基因标志物的筛选及应用。
技术介绍
帕金森病(Parkinson'sdisease,PD)是中老年人常见的一种缓慢进展的神经系统变性疾病,严重影响患者的生活质量。主要临床特征为运动症状,包括静止性震颤、肌强直、运动迟缓和姿势步态异常等。随着我国人口老龄化进程的加快,PD发病率日益增高,发病人数逐年增加,目前我国的PD病患者已超过200万。PD的主要病理变化为α-突触核蛋白(a-synuclein,a-syn)的异常聚集导致中脑黑质致密部多巴胺能神经元的选择性丢失和残存神经元胞浆内路易小体的形成。当PD病患者出现典型的运动症状,此时中脑黑质多巴胺能神经元已存在严重丢失,所以PD早期诊断、早期干预显得尤为重要。目前PD的诊断主要基于患者的临床表现及医生的临床经验,这就导致了不少PD患者被漏诊或误诊。因此,一方面亟需找到灵敏可靠的生物学标志物,另一方面需要操作简便、经济的辅助检查手段为PD诊断提供帮助。目前已有的关于PD生物学标志物研究主要集中在临床症状、神经影像和生物化学几方面:1、PD临床症状:运动症状是目前PD诊断的主要依据,然而运动迟缓、肌强直和静止性震颤这些典型的运动症状只有在多巴胺能神经元大量缺失时才出现,不能作为早期诊断的标记物。非运动症状如嗅觉减退、快动眼睡眠行为障碍以及便秘的发生可远早于运动症状,但对PD诊断的敏感度和特异度不高。2、神经影像:目前已知的PD诊断的影像学方法有正电子发射计算机断层显像(positronemissiontomography,PET)、单光子发射计算机断层成像术(single-photonemissioncomputedtomography,SPECT),磁共振成像(magneticresonanceimaging,MRI)等,均因价格昂贵、实践性不强或特异性差难以推广。3、生物化学:关于PD早期诊断的生物化学标志物研究涉及免疫、炎症、氧化应激、细胞凋亡等多个领域,其中以α-syn最具研究前景。Borghi等首次在脑脊液中检测到α-syn后,有关该项生物学标志物的研究备受关注。然而,PD患者脑脊液α-syn表达水平的变化存有较大争议。由于脑脊液检测在临床应用中的限制,一些研究者开始关注外周血及唾液α-syn表达变化。但是到目前为止,来自血液和唾液样本的研究结果并不完全相同。因此,至今尚未发现一个敏感度和特异性高,可在临床广泛应用的PD诊断的生物学标记物。
技术实现思路
本专利技术的目的是提供一种粪便基因标志物的筛选及应用。本专利技术目的寻找一个敏感度和特异性高可供PD诊断的生物学标记物。本专利技术为解决其技术问题所采用的技术方案是:一种粪便基因标志物的筛选方法,包括如下步骤:(1)收集帕金森病患者与其健康配偶的粪便,于-20~-80℃下保存;(2)提取(1)中粪便基因DNA;(3)鸟枪法测序后进行生物信息分析,建立参考基因集,从帕金森病患者和健康配偶的差异基因中筛出目的基因序列用作基因标志物,进行受试者工作特征(receiveroperatingcharacteristic,ROC)曲线分析,明确其疾病区分能力,具体方法包括如下:S1:粪便基因DNA的质检:利用ThermoNanoDrop2000紫外微量分光光度计和1~3%琼脂糖凝胶电泳进行总DNA质检;S2:基因DNA片段化:1)在1.5mLLoBind管中,用1XLowTEBuffer稀释30ng~1000ng高质量的基因组DNA至120~150μL;2)转移稀释后的基因组DNA至微型管;3)将微型管置于CovarisTubeHolder中,用CovarisS2系统超声打断DNA,设置参数如下:占空比10~15%,强度4~5,每周期循环次数200~250次,时间50-60秒,模式为扫频,温度为6~8℃;4)转移超声后的样本真空浓缩至50μL,获得DNA片段浓缩液;S3:文库构建与质检:对基因组DNA进行片段化,末端修复、3’末端加A、连接接头、富集步骤,完成测序样本文库构建,所建文库使用2.0Fluorometer检测浓度,Agilent2100检测文库的大小;S4:DNA片段测序:按照cBotUserGuide所示相应流程,在IlluminaHiSeq测序仪配套的cBot上完成Cluster生成和第一向测序引物杂交;测序平台为IlluminaHiSeqTen,按照IlluminaUserGuide准备测序试剂,将携有cluster的flowcell上机,选用paired-end程序,进行双端测序,测序过程由Illumina提供的datacollectionsoftware进行控制,并进行实时数据分析,去除Adaptor接头序列不合格的reads,去除包含N碱基数目≥3的reads,对序列3’端进行截切,去掉质量值<20的碱基,并过滤截切后长度<60%原长的reads;通过SOAPaligner比对宿主基因组,将宿主污染的reads剔除,获得cleanreads;S5:序列拼接组装与基因预测:使用metaSPAdes软件对cleanreads进行拼接,采用不用大小的Kmer(21,33,55)对过滤后的数据进行组装,在scaffolds内部gap处,将scaffolds重新打断成新的scafting,去除长度小于500bp的reads,从不同Kmer的组装结果中选择N50最大的组装结果,利用软件MetaGeneMark对组装结果进行开放阅读窗的预测,然后根据得到的.gff注释文件还原成.fna基因序列文件,并从中筛选出长度大于100bp的基因序列,并翻译成对应的氨基酸序列;S6:基因集构建:利用CD-HIT将所有预测出来的基因聚类,其中确认度>95%,覆盖度>90%,选择每一类中最长的基因序列后去除其余冗余基因,从NCBI数据库下载来自中国东部及南方的II型糖尿病和肝硬化项目的肠道基因宏基因组基因,构建全新的基因集,去除少于2条reads支持的基因,获得非冗余基因集;S7:基因初步筛选:绘制了基因数量与非零样本数量的关系图,根据基因数量与非零样本数量的关系图确定非零数量后进行初步基因筛选,获得基因集合;S8:基因丰度及差异基因统计检验:通过SOAPaligener将cleanreads比对上非冗余基因集,根据每个基因被比对上的reads条数与基因的长度,可以计算得到每个基因再样品中的相对丰度,然后根据基因丰度,通过Wilcoxon秩和检验来计算每个基因在帕金森病组和健康配偶对照组的差异,获得差异基因合集,P<0.05;S9:差异基因聚类分析:根据Wilcoxon秩和检验得到帕金森病患者和健康配偶中差异基因集合,进行基因聚类分析(metagenomicspecies,MGS)聚类,计算两两基因在所有样本中丰度值的Pearson相关系数,利用single-linkage聚类算法,要求其类内相关系数不小于0.9,类间相关系数不大于0.1,得到MGS聚类,MGS聚类按照:a)包含基因数目不小于50个;b)根据genome库注释到同一genus;c)genus注释率大于90%,筛选得到MGS组;S1本文档来自技高网
...

【技术保护点】
1.一种粪便基因标志物的筛选方法,包括如下步骤:(1)收集帕金森病患者与其健康配偶的粪便,于‑20~‑80℃下保存;(2)提取(1)中粪便基因DNA;(3)鸟枪法测序后进行生物信息分析,建立参考基因集,从帕金森病患者和健康配偶的差异基因中筛出目的基因序列用作基因标志物,进行受试者工作特征(receiver operating characteristic,ROC)曲线分析,明确其疾病区分能力,具体方法包括如下:S1:粪便基因DNA的质检:利用ThermoNanoDrop 2000紫外微量分光光度计和1~3%琼脂糖凝胶电泳进行总DNA质检;S2:基因DNA片段化:1)在1.5mL LoBind管中,用1X Low TE Buffer稀释30ng~1000ng高质量的基因组DNA至120~150μL;2)转移稀释后的基因组DNA至微型管;3)将微型管置于Covaris Tube Holder中,用Covaris S2系统超声打断DNA,设置参数如下:占空比10~15%,强度4~5,每周期循环次数200~250次,时间50‑60秒,模式为扫频,温度为6~8℃;4)转移超声后的样本真空浓缩至50μL,获得DNA片段浓缩液,所述DNA片段长度为500~600bp;S3:文库构建与质检:对基因组DNA进行片段化,末端修复、3’末端加A、连接接头、富集步骤,完成测序样本文库构建,所建文库使用...

【技术特征摘要】
1.一种粪便基因标志物的筛选方法,包括如下步骤:(1)收集帕金森病患者与其健康配偶的粪便,于-20~-80℃下保存;(2)提取(1)中粪便基因DNA;(3)鸟枪法测序后进行生物信息分析,建立参考基因集,从帕金森病患者和健康配偶的差异基因中筛出目的基因序列用作基因标志物,进行受试者工作特征(receiveroperatingcharacteristic,ROC)曲线分析,明确其疾病区分能力,具体方法包括如下:S1:粪便基因DNA的质检:利用ThermoNanoDrop2000紫外微量分光光度计和1~3%琼脂糖凝胶电泳进行总DNA质检;S2:基因DNA片段化:1)在1.5mLLoBind管中,用1XLowTEBuffer稀释30ng~1000ng高质量的基因组DNA至120~150μL;2)转移稀释后的基因组DNA至微型管;3)将微型管置于CovarisTubeHolder中,用CovarisS2系统超声打断DNA,设置参数如下:占空比10~15%,强度4~5,每周期循环次数200~250次,时间50-60秒,模式为扫频,温度为6~8℃;4)转移超声后的样本真空浓缩至50μL,获得DNA片段浓缩液,所述DNA片段长度为500~600bp;S3:文库构建与质检:对基因组DNA进行片段化,末端修复、3’末端加A、连接接头、富集步骤,完成测序样本文库构建,所建文库使用2.0Fluorometer检测浓度,Agilent2100检测文库的大小;S4:DNA片段测序:按照cBotUserGuide所示相应流程,在IlluminaHiSeq测序仪配套的cBot上完成Cluster生成和第一向测序引物杂交;测序平台为IlluminaHiSeqTen,按照IlluminaUserGuide准备测序试剂,将携有cluster的flowcell上机,选用paired-end程序,进行双端测序,测序过程由Illumina提供的datacollectionsoftware进行控制,并进行实时数据分析,去除Adaptor接头序列不合格的reads,去除包含N碱基数目≥3的reads,对序列3’端进行截切,去掉质量值<20的碱基,并过滤截切后长度<60%原长的reads;通过SOAPaligner比对宿主基因组,将宿主污染的reads剔除,获得cleanreads;S5:序列拼接组装与基因预测:使用metaSPAdes软件对cleanreads进行拼接,采用不用大小的Kmer(21,33,55)对过滤后的数据进行组装,在scaffolds内部gap处,将scaffolds重新打断成新的scafting,去除长度小于500bp的reads,从不同Kmer的组装结果中选择N50最大的组装结果,利用软件MetaGeneMark对组装结果进行开放阅读窗的预测,然后根据得到的.gff注释文件还原成.fna基因序列文件,并从中筛选出长度大于100bp的基因序列,并翻译成对应的氨基酸序列;S6:基因集构建:利用CD-HIT将所有预测出来的基因聚类,其中确认度>95%,覆盖度>90%,选择每一类中最长的基因序列后去除其余冗余基因,从NCBI数据库下载来自中国东部及南方的II型糖尿病和肝硬化项目的肠道基因宏基因组基因,构建全新的基因集,去除少于2条reads支持的基因,获得非冗余基因集;S7:基因初步筛选:绘制了基因数量与非零样本数量的关系图,根据基因数量与非零样本数量的关系图确定非零数量后进行初步基因筛选,获得基因集合;S8:基因丰度及差异基因统计检验:通过SOAPaligener将cleanreads比对上非冗余基因集,根据每个基因被比对上的reads条数与基因的长度,可以计算得到每个基因再样品中的相对丰度,然后根据基因丰度,通过Wilcoxon秩和检验来计算每个基因在帕金森病组和健康配偶对照组的差异,获得差异基因合集,P<0.05;S9:差异基因聚类分析:根据Wilcoxon秩和检验得到帕金森病患者和健康配偶中差异基因集合,进行基因聚类分析(met...

【专利技术属性】
技术研发人员:肖勤钱逸维陈生弟杨晓东徐绍卿
申请(专利权)人:上海交通大学医学院附属瑞金医院
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1