【技术实现步骤摘要】
一种高度近视致病变异体的筛选方法、系统及设备
[0001]本专利技术涉及计算机数据处理领域,更具体地,涉及一种高度近视致病变异体的筛选方法
、
系统
、
设备及存储介质
。
技术介绍
[0002]高度近视通常定义为屈光度小于
–
6.00D
或眼轴长度大于
26.0mm
,其发病机制尚不清楚
。
我国青少年近视比例随年龄增长不断上升
。
高度近视除影响正常视觉功能外,还会大幅增加视网膜脱落
、
青光眼
、
黄斑变性等致盲性眼病的发生风险
。
许多研究表明遗传因素在近视中发挥着至关重要的作用,其中,在高度近视中更为明显
。
超高度近视为屈光度小于
‑
10.0D
的严重高度近视,其引发严重眼部后遗症的概率比起高度近视患者大大增加,且受遗传因素的影响更大
。
虽然人们已经认识到近视具有高度的遗传性,但直到最近,在剖析高度近视遗传背景方面才取得了重大进展
。
双胞胎和家族研究表明,高度近视的遗传率很高,估计约为
90
%
。
由于眼球的复杂结构,解释高度近视的遗传机制也比较困难
。
高度近视存在许多可叠加
、
影响较小的遗传变异,在眼球所有组织及细胞都有表达,通常与已知的神经传递或细胞外基质功能有关
。
尽管对高度近
【技术保护点】
【技术特征摘要】
1.
一种高度近视致病变异体的筛选方法,其特征在于,所述方法包括:获取待测样本的外显子测序数据及临床数据;将所述外显子测序数据与人类参考基因组序列进行比对,从所述待测样本的外显子测序数据中筛选得到变异数据;对所述变异数据进行注释得到变异体的注释信息,所述注释信息包括下列中的任意一种或几种:同义变异
、
良性的错义变异
、
损伤性错义变异
、
功能丧失变异;基于所述待测样本的临床数据和注释信息中的变异计数预测待测样本是否为高度近视;如果所述待测样本为高度近视,将损伤性错义变异和
/
或功能丧失变异所在的基因和数据集中高度近视样本进行关联分析,筛选出高度近视相关的候选基因及基因上的变异体;分析所述候选基因在眼部组织单细胞转录表达情况,筛选出在眼部组织单细胞转录表达显著的眼部相关候选基因,所述眼部相关候选基因上的变异体作为高度近视致病变异体
。2.
根据权利要求1中所述的高度近视致病变异体的筛选方法,其特征在于,所述注释信息中的变异计数包括下列中的一种或几种:变异的全外显子计数
、
同义变异计数
、
良性的错义变异计数
、
损伤性错义变异计数
、
功能丧失变异计数;可选的,将所述待测样本的临床数据和注释信息中的变异计数输入分类模型得到预测样本是否为高度近视的分类结果;可选的,将所述待测样本的临床数据和注释信息中的变异计数输入逻辑回归模型得到预测样本是否为高度近视的分类结果;优选的,所述数据集为公共或自有测序的含变异数据的数据集;优选的,所述变异包括单核苷酸变异
、
插入和
/
或删除变异
。3.
根据权利要求1中所述的高度近视致病变异体的筛选方法,其特征在于,所述基于所述待测样本的临床数据和注释信息中的变异计数预测待测样本是否为高度近视,可选的,基于所述待测样本的临床数据
、
同义变异计数
、
良性的错义变异计数预测样本是否为高度近视
。4.
一种高度近视致病变异体的筛选方法,其特征在于,所述方法包括:获取数据集中样本的外显子测序数据及分类标签,所述标签为高度近视病例和对照;将所述外显子测序数据与人类参考基因组序列进行比对,从所述样本的外显子测序数据中筛选得到变异数据;对所述变异数据进行注释得到变异体的注释信息,所述注释信息包括损伤性错义变异和
/
或功能丧失变异;将所述损伤性错义变异和
/
或功能丧失变异所在的基因和数据集中高度近视样本进行关联分析,筛选出高度近视相关的候选基因及基因上的变异体;分析所述候选基因在眼部组织单细胞转录表达情况,筛选出在眼部组织单细胞转录表达显著的眼部相关候选基因,所述眼部相关候选基因上的变异体作为高度近视致病变异体
。5.
根据权利要求1‑4任意一项所述的高度近视致病变异体的筛选方法,其特征在于,所述方法还包括对所述变异数据进行质量控制,所述质量控制包括:排除样本:如果样本的平
均召回率
<0.9、
【专利技术属性】
技术研发人员:郁相宜,于晓光,杜政霖,邢世来,
申请(专利权)人:上海谱希和光基因科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。