一种基于低深度制造技术

技术编号:39499619 阅读:6 留言:0更新日期:2023-11-24 11:29
本发明专利技术公开了一种基于低深度全基因组测序技术建立宫颈疾病进展预测模型的方法,使用宫颈刮片或阴道拭子采集脱落细胞,提取

【技术实现步骤摘要】
一种基于低深度WGS建立宫颈疾病进展预测模型的方法


[0001]本专利技术属于医学辅助筛查领域,具体涉及使用低深度全基因组测序技术,通过对测序结果进行分析,计算基因组不稳定性指数,建立一种宫颈疾病进展的预测模型,进而预测宫颈疾病进展


技术介绍

[0002]宫颈癌是全球女性常见癌症之一,在发展中国家发病率仍呈上升趋势
。2018
年的
GLOBOCAN
报告显示,
85%
的宫颈癌死亡病例发生于欠发达国家,这些中低收入国家的宫颈癌死亡病例是发达国家的
18
倍,中国和印度占据了全球
1/3
以上的宫颈癌病例

早期检测的宫颈癌患者的五年生存率为
92%
,但宫颈癌起病多隐匿,早期常没有症状,发现时多处于晚期,治疗选择较少且预后较差
。2023
年第1版
《NCCN
子宫颈癌临床实践指南

数据显示,由于发展中国家大部分人无法进行筛查,每年约有
275,000
人死于宫颈癌

作为目前唯一病因明确

可防也可控的恶性肿瘤,宫颈癌的早期检测对宫颈癌的干预和治疗具有重要意义

[0003]基因组不稳定性(
Genome Instability, GI
)是指细胞或个体基因组中发生异常的遗传变化的倾向或趋势

基因组不稳定性主要包括染色体不稳定性/>、
点突变和核苷酸改变

拷贝数变异等

基因组不稳定性的增加可能导致癌症细胞的产生和发展

许多癌症类型都与基因组不稳定性有关,包括宫颈癌

乳腺癌

结肠癌等

拷贝数变异(
Copy Number Variation, CNV
)通常指与基因组参考序列相比,基因组中长度在
1Kb
以上的
DNA
片段发生了基因组结构变异,包括显微水平和亚显微水平的
DNA
缺失

插入

倒位

易位和
/
或重复

拷贝数变异是人类许多疾病(如肿瘤

遗传性疾病

神经系统和自身免疫疾病等)的重要致病因素之一

[0004]研究表明,
HPV
是促进宫颈癌发生发展的重要病原体,但约
90%

HPV
感染都会在1‑2年内被机体的免疫系统清除,只有不到
2%
的女性会罹患宫颈癌

在影响因素方面,除
HPV
感染外,宿主基因组改变会导致癌前病变发展为浸润性癌症

另外,多项研究结果显示,拷贝数的增加或缺失通常会导致癌症基因组中抑癌基因失活,或影响癌基因的表达,是肿瘤发生发展的重要因素

例如,
Mittal
等的研究指出,持续性
HPV
感染且基因组拷贝数较高的患者,其从低级别宫颈病变发展为高级别宫颈病变的风险更大;
Loharamtaweethong
等人研究发现,
PD

L1
基因拷贝数的增加与局部晚期宫颈癌有关

在检测方式方面,相较于传统的细胞学检测,
HPV
检测灵敏度高

重复性强,但
HPV
筛查结果的假阳性概率较高

因此,采用一种准确率高且成本效益高的方式检测拷贝数变异对宫颈癌筛查及宫颈病变分级预测具有重要意义

[0005]目前,用于检测细胞基因组不稳定性的方法主要有:(1)显带核型分析技术,又称核型分析(
karyotype analysis
);(2)分子杂交技术,包括荧光原位杂交(
FISH


染色体微阵列分析技术(
CMA
)等;(3)聚合酶链式反应相关技术,包括聚合酶链式反应(
PCR


实时定量
PCR

qPCR


限制性片段长度多态性

微卫星
DNA
多态性和变性高效液相色谱(
DHPLC
)等;(4)基因测序技术,包括一代测序(
Sanger
测序),二代测序(
NGS
),又称高通量测序,其中二
代测序又包含全基因组测序(
WGS


基因组拷贝数变异测序(
CNV

seq


全外显子测序(
WES
)和单细胞测序(
single cell sequencing


[0006]其中,核型分析技术一直被认为是确诊染色体畸变的“金标准”,但其检测周期长

分辨率较低,无法检出
5Mb
以下的
CNVs
;用于全基因组范围
CNVs
检测技术
CMA
,技术成本较高

通量较低,且由于
CMA
所使用的芯片探针覆盖范围有限,可能导致部分致病性基因组拷贝数变异(
pathogenic copy number variations, pCNVs
)无法被检出;单细胞测序依赖基因扩增,所以在测序偏差和充足的基因组覆盖率方面仍存在较大挑战

[0007]本专利技术中涉及的基因组拷贝数变异测序为一种高通量测序方法,该测序方法对
DNA
进行低深度全基因组测序(
Whole Genome Sequencing, WGS
),将测序结果与人类参考基因组序列进行比对,通过生物信息学分析发现受检样本存在的
CNVs
,其可检测低至
5%
的染色体非整倍体嵌合

相对于现有的检测技术,低深度全基因组拷贝数变异测序成本效益高

操作简便

检测范围广,所需检测的
DNA
样本量低

[0008]基于此,本专利技术通过为低深度全基因组测序技术配备一套合适的模型,提供一种准确率高

成本效益高的基因组不稳定性检测方法,进而预测宫颈疾病进展


技术实现思路

[0009]为解决现有检测技术灵敏度低

重复性差及准确率不高的问题,通过使用宫颈刮片或阴道拭子采集的脱落本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于低深度全基因组测序技术测定基因组不稳定性指数的方法,其特征在于,包括以下步骤:步骤一:通过宫颈刮片或阴道拭子方式收集宫颈脱落细胞;步骤二:收集的宫颈脱落细胞中提取
DNA
样本,采用
PE150
的建库方式进行全基因组测序,平均测序深度为
0.5

1X
;步骤三:获得
DNA
样本的低深度全基因组测序的原始下机数据;步骤四:将上述原始数据进行标准质控,然后将其与标准人类参考基因组序列进行比对并标记重复序列;步骤五:通过如下公式计算基因组不稳定性指数:;其中,
n

5547

i
为自然数,
GII
表示上述步骤二样本的基因组不稳定性指数
。2.
根据权利要求1所述的一种基于低深度全基因组测序技术测定基因组不稳定性指数的方法,其特征在于,步骤五具体包括以下步骤:
S1
‑1:将原始下机数据的结果序列与标准人类参考基因组序列进行比对;
S1
‑2:将标准人类参考基因组按照排列顺序划分为
n
个大小为
500kb
的非重叠连续窗口;
S1
‑3:去除非重叠连续窗口中的
blacklist
区域,同时去除
X
染色体和
Y
染色体;
S1
‑4:使用
CNVkit
计算每个区域的拷贝数,进而计算基因组不稳定性指数
。3.
一种用于宫颈疾病进展评估的预测模型的构建方法,其特征在于,包括以下步骤:步骤
A
:将权利要求1中的原始下机数据分为两个部分,分别为:训练集(
80%
),测试集(
20%
);步骤
B
:通过“sklearn”库对所述训练集进行监督式机器学习,利用随机森林进行特征重要性排序,采用
Lasso

【专利技术属性】
技术研发人员:董辉曾晓陈志李利鸿赵加栋池华斌金维荣周宏骏张杏杏
申请(专利权)人:申友基因组研究院南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1