基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法技术

技术编号:36193520 阅读:28 留言:0更新日期:2022-12-31 21:14
本发明专利技术公开了一种基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法,该方法包括以下步骤:获得口腔溃疡患者和健康人群的口腔颊部组织样本RNA数据;对样本RNA数据进行双端测序处理,得到全长转录组数据;根据相对差异表达分析,确定全长转录组特征数据;将特征数据输入预先建立的机器学习模型中进行训练,获得复发性口腔溃疡相关基因。本申请通过第三代nanopore测序,获得高质量的全长转录本,增加序列对比的准确性和可靠性;获得复发性相关基因数据更准确、全面。全面。全面。

【技术实现步骤摘要】
基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法


[0001]本专利技术涉及基因测序
和生物信息学
,特别涉及一种基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法。

技术介绍

[0002]随着人类基因组计划(human)的顺利完成,基因组测序技术取得了长足的进步,在过去的十几年间,下一代测序技术(next

generation sequencing,NGS)的不断进步使得基因组测序的成本不断降低、测序的通量和测序精度不断提高,这为人们在解构复杂的基因组结构和回答基因组变异导致的表型变化和疾病发生原理时提供了重要的技术支持。然而,NGS测序中构建文库过程因为PCR引入的扩增错误导致的测序质量问题以及测序序列的读长限制(通常小于500bp)使得NGS技术难以满足一些现代生物学问题的更高要求:例如DNA上较长的重复片段的测定、DNA/RNA甲基化修饰问题的测定等。一般的二代测序,由于RNA

seq的读长受限,需要进行重新拼接。而三代测序可以直接对RNA进行测序,之前很多由于拼接而被忽略的可变剪接可以直接被检测到。此外,二代测序技术速度较慢,无法实时测序,对于口腔溃疡的组织测序具有延时性,损失基因信息。因此,能够测定更长读长的序列(最长可达10kbp),且无需复杂的文库构建过程的第三代测序技术
‑‑
纳米孔测序技术(Nanopore Sequencing)应运而生,近年来受到学界广泛的关注。三代nanopore测序属于短读长测序技术,包括两种方式:边连接边测序(sequencing by ligation,SBL)以及边合成边测序(sequencing by synthesis,SBS)。目前,普遍使用的后者,其中以Illumina平台为代表。SBS方法依赖于单信号标记dNTP来对链进行延伸。四种核糖核酸都必须反复添加到测序反应过程中。不仅如此,SBS不需要将dNTP屏蔽,因为测序反应过程中下一个碱基的缺失会阻止链的延伸。碱基的寡聚体则是一个例外,在这种情况下,信号的强度会随着dNTP数量的增加而成比例的增强。
[0003]口腔溃疡为口腔粘膜中最常见的疾病之一,以青壮年多见,相当于复发性口腔溃疡。发生后,如果溃疡处没有很快愈合,种种细菌病毒就可能经由进程患处蔓延到咽部诱发急性咽喉炎、牙龈炎等一系列咽部疾病,这也是反复出现口腔溃疡的危害。口腔溃疡会给患者带来较大的疼痛感,严重的情况下会影响到患者的睡眠,甚至会出现进食比较困难的现象,同时也会有一些并发症产生,例如,淋巴结肿大、口臭以及慢性咽炎等并发症。对患者的生活工作造成极大的困扰。因此,预防口腔溃疡的发病风险,调节生活习惯配合相关的护理措施,对于口腔溃疡患者具有积极意义。
[0004]本研究基于机器学习方法(SVM),从数学建模、数据挖掘和系统设计实现三个方面,构建一种筛查复发性口腔溃疡相关基因的检测方法。通过对nanopore测序数据的标准化预处理、分析定量,构建机器学习分类模型,获得了一个基于人类全长转录本为特征的复发性口腔溃疡相关基因的鉴定方法,对复发性口腔溃疡相关基因的检测具有重要意义。

技术实现思路

[0005]本专利技术所要解决的技术问题是提供基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法,其通过第三代nanopore测序,获得高质量的全长转录本,增加序列对比的准确性和可靠性;获得复发性相关基因数据更准确、全面。
[0006]本专利技术所要解决的技术问题是通过以下技术方案来实现的:
[0007]一种基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法,包括以下步骤:
[0008](1):从口腔颊部组织样品中提取总RNA,并进行纯化;
[0009](2):用nanopore对纯化后的RNA进行全长转录组测序;
[0010](3):对测序后全长转录组的数据进行分析;
[0011](4):利用表达定量得到的转录本在各个样品中的表达量reads count数据,使用DESeq2软件进行差异表达分析,筛选阈值为qvalue<0.05且|log2FoldChange|>2,最终获得复发相关性基因数据;
[0012](5):对所述特征基因数据分成测试样本和训练样本,基于所述训练样本对多个分类器进行训练,得到训练后分类器;集成训练后分类器,建立预测模型。
[0013]优选地,步骤(1)具体为:获取口腔溃疡患者复发溃疡组织和对侧正常组织,并进行预处理形成口腔溃疡发病数据,包括进行RNA提取、质控。
[0014]优选地,步骤(1)中,使用试剂盒BIOG RNA Swab Kit提取并纯化溃疡组织和对侧正常组织样本中的RNA。
[0015]优选地,步骤(2)包括以下步骤:
[0016](21)建立文库:使RNA链长度最大化;然后使用Oligo DT作为引物对目标mRNA进行反转;随后低循环PCR扩增全长CDNA,加测序接头(含马达蛋白),构建完成的文库;
[0017](22)进行nanopore全长转录组测序:将文库加载到Flow cells R9.4测序芯片,插入测序仪MinION对文库进行测序,获得三代全长转录本数据。
[0018]优选地,步骤(2)中,使用试剂盒SQK

PCS109+SQK

PBK004进行文库构建。
[0019]优选地,步骤(3)包括以下步骤:
[0020](31)对测序数据进行质控与组装,其中,所述质控为通过软件pycoQC评估数据质量,包括序列读长分布和质量分布;使用软件Flye对质控后数据的进行组装,并使用mekada对组装后的序列纠错;
[0021](32)使用软件Pychopper鉴定有效测序数据中的全长序列;使用Pinfish软件对全长序列快速构建非冗余转录本集;随后使用minimap2软件将一致性序列比对到参考基因组上。
[0022]优选地,在步骤(31)前,还包括:
[0023](30)通过软件pycoQC评估数据质量前,还包括将原始测序文件转换成fastq格式的数据文件并去除序列的接头。
[0024]优选地,在步骤(32)中,使用blastp进行比对的参数为e

value为1e

10,相似度80%,序列覆盖度70%。
[0025]一种基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法在口腔颊部组织样品检测中的应用。
[0026]一种基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法在制备治疗复发性口腔溃疡药物中的应用。
[0027]一种基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法在制备复发性口腔溃疡相关医疗器械中的应用。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法,其特征在于,包括以下步骤:(1):从口腔颊部组织样品中提取总RNA,并进行纯化;(2):用nanopore对纯化后的RNA进行全长转录组测序;(3):对测序后全长转录组的数据进行分析;(4):利用表达定量得到的转录本在各个样品中的表达量reads count数据,使用DESeq2软件进行差异表达分析,筛选阈值为qvalue<0.05且|log2FoldChange|>2,最终获得复发相关性基因数据;(5):对所述特征基因数据分成测试样本和训练样本,基于所述训练样本对多个分类器进行训练,得到训练后分类器;集成训练后分类器,建立预测模型。2.根据权利要求1所述的基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法,其特征在于,步骤(1)具体为:获取口腔溃疡患者复发溃疡组织和对侧正常组织,并进行预处理形成口腔溃疡发病数据,包括进行RNA提取、质控。3.根据权利要求1所述的基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法,其特征在于,步骤(1)中,使用试剂盒BIOG RNA Swab Kit提取并纯化溃疡组织和对侧正常组织样本中的RNA。4.根据权利要求1所述的基于Nanopore全长转录组测序检测口腔组织样品中复发性溃疡相关基因的方法,其特征在于,步骤(2)包括以下步骤:(21)建立文库:使RNA链长度最大化;然后使用Oligo DT作为引物对目标mRNA进行反转;随后低循环PCR扩增全长CDNA,加测序接头,含马达蛋白,构建完成的文库;(22)进行nanopore全长转录组测序:将文库加载到Flow cells R9.4测序芯片,插入测序仪MinION对文库进行测序,获得三代全长转录本数据。5.根据权利要求1所述的基于Nanopore全长转录组测序检测口腔组织样品中复发...

【专利技术属性】
技术研发人员:高茜米其利刘凯管莹蒋佳芮王姝亚邢佳鑫李振杰邓乐乐
申请(专利权)人:云南中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1