一种非小细胞肺癌驱动基因筛选与功能分析的方法技术

技术编号:15437728 阅读:98 留言:0更新日期:2017-05-26 03:44
本发明专利技术公开了一种非小细胞肺癌驱动基因筛选与功能分析的方法,该方法包括以下步骤:利用IntOGen数据库筛选NSCLC两个亚型肺鳞癌和肺腺癌的驱动基因;利用Venn图制作确定肺鳞癌和肺腺癌共有的驱动基因;利用生物信息学技术进行GO基因富集功能和KEGG通路分析;驱动基因的蛋白互相作用网络图绘制。本发明专利技术挖掘并筛选NSCLC的驱动基因,并进行生物信息学分析。希望能从对NSCLC的生物学性质,以及NSCLC发生、发展过程中基本的分子机制的研究得到深刻认识,为NSCLC的诊断提供检测标志物及新的治疗点,也为疾病的预防和治疗等提供可靠的科学依据。

Method for screening and functional analysis of non small cell lung cancer driving gene

The invention discloses a method for non small cell lung cancer gene screening and analysis of the driving function, the method comprises the following steps: using IntOGen database driven gene screening NSCLC two subtypes of lung squamous cell carcinoma and lung adenocarcinoma; gene map to determine driving lung squamous carcinoma and adenocarcinoma were Venn by using biological information; technical analysis of GO gene enrichment function and KEGG pathway; protein interaction network drive mapping. The invention excavates and screens the driving genes of NSCLC and carries out bioinformatic analysis. Hope from the biological characters of NSCLC, and NSCLC, to study the basic molecular mechanism in the development process has a profound understanding, provide a marker and new therapeutic point for the diagnosis of NSCLC, but also provide a reliable scientific basis for disease prevention and treatment.

【技术实现步骤摘要】
一种非小细胞肺癌驱动基因筛选与功能分析的方法
本专利技术属于生物
,涉及一种非小细胞肺癌驱动基因筛选与功能分析的方法,具体地说,涉及一种利用多种数据库进行非小细胞肺癌驱动基因筛选与功能分析的方法。
技术介绍
肺癌是中国,以及全球发病率及死亡率第一的恶性肿瘤。在过去的40年间,肺癌的5年生存率仅从12%上升至16%,最主要原因是诊断时已属晚期,相反,早期诊断的肺癌进行手术后生存率可提高到80%。可见,早发现、早期诊断对肺癌的治疗及预后具有重要的临床意义。当前广泛运用的检测手段包括无创检查(如X线、CT、钼靶摄片等)和有创检查(纤维支气管镜、支气管造影、B超或CT定位下穿刺活检等),但缺乏依从性和普及运用的可能。因此,探讨肺癌分子致病机理并找寻新的肺癌分子标志物,让肺癌患者能够及时有效的早查、早诊、早治,是提高肺癌患者生存率、降低死亡率的关键科学问题。尽管目前有一些肿瘤标志物,如CA125(癌抗原125)、CA19-9(癌抗原19-9)、CEA(癌胚抗原)等可用于肺癌的检测,但敏感性和特异性均不高,所以目前为止,尚没有理想的可供临床使用的肺癌早期筛查和诊断标志物。不断地发现和鉴定新的肺癌相关癌基因/蛋白仍是一项重要的工作。癌症通常是由于DNA突变的积累造成的。驱动基因(Drivergene)的突变是导致癌症的最主要原因,到目前为止,研究者致力于找到导致癌症的个体基因和细胞的改变途径。近年来,临床已经发现了一系列肺癌的驱动基因,包括ALK、EGFR、BRAF、KRAS及HER2突变等。在亚裔肺腺癌患者中,87%的患者被发现已知驱动基因,其中81%的驱动基因已有明确的靶向抑制剂。因此,驱动基因的发现可以为探讨癌症发病机制、寻找个体化治疗靶点,以及筛选潜在的肿瘤诊断标志物提供理论依据。肿瘤基因组学综合数据库(TheIntegrativeOncogenomicsdatabase,IntOGen)整合了用组织分类的多维的人类肿瘤基因组学数据,其中组织名符合ICD-O命名规范。IntOGen数据库使不同变异类型(如基因突变,拷贝数改变)的数据挖掘成为可能。数据库操作简单,数据全面,免费共享,并为后期数据挖掘和信息推广提供了良好的平台。IntOGen数据库在分子生物学领域中有着广泛的应用前景,为癌症驱动基因的挖掘与筛选提供了最佳平台。非小细胞肺癌(Non-SmallCellLungCancer,LSCLC)是肺癌的主要病理类型,本专利技术通过对IntOGen数据库中NSCLC(包括肺腺癌(LungAdenocarcinoma,LUAD)和肺鳞癌(LungSquamousCellCarcinoma,LUSC))的基因突变数据进行挖掘,寻找肺鳞癌和肺腺癌共有的驱动基因,并利用DAVID和STRING数据库对这些基因进行功能富集和通路分析。本专利技术旨在提供一种利用多种数据库挖掘癌症驱动基因的方法,为非小细胞肺癌分子机理的探讨与临床肿瘤标志物的筛选提供可行的方法和依据。
技术实现思路
本专利技术的目的在于提供一种非小细胞肺癌驱动基因筛选与功能分析的方法,利用IntOGen数据库分别筛选肺鳞癌和肺腺癌驱动基因,通过Venn图制作确定肺鳞癌和肺腺癌共有的驱动基因,利用DAVID数据库对筛选出的驱动基因进行GO功能富集分析和KEGG通路富集分析,利用STRING数据库进行蛋白间相互作用分析,为NSCLC的肿瘤标志物筛选、分子发病机制等提供有意义的探索和依据。其具体技术方案为:一种非小细胞肺癌驱动基因筛选与功能分析的方法,包括以下步骤:1)利用IntOGen数据库筛选NSCLC两个亚型肺鳞癌和肺腺癌的驱动基因:在IntOGen数据库中查找“lungadenocarcinoma”和“lungsquamouscellcarcinoma”,获得肺腺癌和肺鳞癌驱动基因的信息,肺腺癌纳入了两个研究平台391个样本的数据,肺鳞癌纳入了一个研究平台174个样本的数据。共发现181个肺腺癌驱动基因和147个肺鳞癌驱动基因。2)利用Venn图制作确定肺鳞癌和肺腺癌共有的驱动基因:为了寻找NSCLC,即肺腺癌和肺鳞癌,共有的驱动基因,利用Venn图在线制作工具寻找两个集合中共有的基因。结果发现91个肺鳞癌和肺腺癌共有的驱动基因。其中突变率比较高的有TP53,CDKN2A,KEAP1,NF1,RB1等。3)利用生物信息学技术进行GO基因富集功能和KEGG通路分析:利用DAVID在线软件对91个驱动基因进行生物信息学分析,为NSCLC标志物筛选及分子机制研究提供依据。基因本体论数据库可以对基因和蛋白功能进行描述和限定,GO包括了三级结构的标准语言,主要包括分子功能(molecularfunction,MF)、生物学途径(biologicalprocess,BP)和细胞学组件(cellcomponent,CC)。通过DAVID在线软件选择GO数据库,生物学过程分析表明这些驱动基因共参与了64种分子功能,主要涉及proteinbinding(蛋白结合),poly(A)RNAbinding(poly(A)RNA结合),ATPbinding(ATP结合),proteinkinasebinding(蛋白激酶结合),chromatinbinding(染色质结合),receptorsignalingproteinserine/threoninekinaseactivity(受体信号蛋白丝氨酸/苏氨酸激酶活性),proteinphosphatasebinding(蛋白磷酸酶结合),identicalproteinbinding(相同蛋白结合),transcriptionfactorbinding(转录因子结合),cadherinbindinginvolvedincell-celladhesion(钙粘蛋白结合参与的细胞间粘附)等。参与了51种生物学途径,主要涉及positiveregulationoftranscriptionfromRNApolymeraseIIpromoter(RNA聚合酶II启动子的转录正调节),positiveregulationoftranscription(转录正调节),embryoniccranialskeletonmorphogenesis(胚胎颅骨骨骼形态发生),Rasproteinsignaltransduction(Ras蛋白信号转导),inuteroembryonicdevelopment(子宫内胚胎发育),viralprocess(病毒过程),MAPKcascade(MAKP级联)等。参与了34种细胞组件的构成,主要包括nucleoplasm(细胞核浆质),cytosol(胞质溶胶),nucleus(细胞核),cytoplasm(细胞浆),cell-celladherensjunction(细胞粘附连接),focaladhesion(焦点粘附),membrane(膜)等。KEGG通路分析结果发现,这些基因主要参与Pathwaysincancer(癌症通路),Pancreaticcancer(胰腺癌),Prostatecancer(前列腺癌),Melanoma(黑色素瘤),Non-smallcelllungcancer(非小细胞肺癌本文档来自技高网
...
一种非小细胞肺癌驱动基因筛选与功能分析的方法

【技术保护点】
一种非小细胞肺癌驱动基因筛选与功能分析的方法,其特征在于,包括以下步骤:1)利用IntOGen数据库筛选NSCLC两个亚型肺鳞癌和肺腺癌的驱动基因:在IntOGen数据库中查找“lung adenocarcinoma”和“lung squamous cell carcinoma”,获得肺腺癌和肺鳞癌驱动基因的信息,肺腺癌纳入了两个研究平台391个样本的数据,肺鳞癌纳入了一个研究平台174个样本的数据;共发现181个肺腺癌驱动基因和147个肺鳞癌驱动基因;2)利用Venn图制作确定肺鳞癌和肺腺癌共有的驱动基因:为了寻找NSCLC,即肺腺癌和肺鳞癌,共有的驱动基因,利用Venn图在线制作工具寻找两个集合中共有的基因;结果发现91个肺鳞癌和肺腺癌共有的驱动基因;其中突变率比较高的有TP53,CDKN2A,KEAP1,NF1,RB1;3)利用生物信息学技术进行GO基因富集功能和KEGG通路分析:利用DAVID在线软件对91个驱动基因进行生物信息学分析,为NSCLC标志物筛选及分子机制研究提供依据;基因本体论数据库对基因和蛋白功能进行描述和限定;4)驱动基因的蛋白互相作用网络图绘制当蛋白质相互作用网络被破坏时,会引发细胞功能的障碍;研究这些相互作用有助于构建相关的网络模型,从而对细胞甚至疾病发生的分子机制进行解释。...

【技术特征摘要】
1.一种非小细胞肺癌驱动基因筛选与功能分析的方法,其特征在于,包括以下步骤:1)利用IntOGen数据库筛选NSCLC两个亚型肺鳞癌和肺腺癌的驱动基因:在IntOGen数据库中查找“lungadenocarcinoma”和“lungsquamouscellcarcinoma”,获得肺腺癌和肺鳞癌驱动基因的信息,肺腺癌纳入了两个研究平台391个样本的数据,肺鳞癌纳入了一个研究平台174个样本的数据;共发现181个肺腺癌驱动基因和147个肺鳞癌驱动基因;2)利用Venn图制作确定肺鳞癌和肺腺癌共有的驱动基因:为了寻找NSCLC,即肺腺癌和肺鳞癌,共有的驱动基因,利用Venn图在线制作工具寻找两个集合中共有的基因;结果发现91个肺鳞癌和肺腺癌共有的驱动基因;其中突变率比较高的有TP53,CDKN2A,KEAP1,NF1,RB1;3)利用生物信息学技术进行GO基因富集功能和KEGG通路分析:利用DAVID在线软件对91个驱动基因进行生物信息学分析,为NSCLC标志物筛选及分子机制研究提供依据;基因本体论数据库对基因和蛋白功能进行描述和限定;4)驱动基因的蛋白互相作用网络图绘制当蛋白质相互作用网络被破坏时,会引发细胞功能的障碍;...

【专利技术属性】
技术研发人员:代丽萍欧阳军方慧玲王晓张建营
申请(专利权)人:河南省医药科学研究院
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1