【技术实现步骤摘要】
判断融合基因真实性的方法和电子装置
[0001]本专利技术涉及融合基因检测领域,具体而言,涉及一种判断融合基因真实性的方法和电子装置。
技术介绍
[0002]融合基因(fusion gene)是指由两个或更多基因的片段融合而成的新基因。在肿瘤组织中,融合基因是一种常见的基因结构异常,两个基因的片段融合在一起产生了一个新的融合基因,具有不同于原始基因的序列结构和功能。肿瘤组织中的融合基因在癌症的发生和发展过程中起着重要的作用。融合基因可以通过多种机制改变细胞的生长、分化和凋亡等关键过程,从而促进肿瘤的形成。
[0003]在现有技术中,可以通过传统的PCR方法对融合断点设计探针进行验证,也可以结合一定的生物信息学方法,对发生融合的蛋白结构域进行分析,再结合已发表文献对筛选出可能与该肿瘤相关的融合基因。但传统PCR验证的方法需要而外的时间成本和资金成本,另外由于临床样本多为FFPE样本,样本提取核酸的难度较大,验证结果不一定准确。通过生物信息学的方法需要一定的技术积累和经验,且具有一定的主观性,不同人鉴定的结果会有差异。< ...
【技术保护点】
【技术特征摘要】
1.一种判断融合基因真实性的方法,其特征在于,所述方法包括:a)将RNA测序数据与参考基因组比对,获得测序比对文件;b)将所述融合基因的原始基因的外显子区域根据碱基长度进行拆分,获得多个所述碱基长度相同的区域;c)计算每个所述区域在所述测序比对文件上的测序深度,获得每个所述区域的测序深度;d)对每个所述区域的测序深度进行归一化处理,获得归一化测序深度;e)比较位于融合断点两侧的所述区域的所述归一化测序深度,若所述融合断点两侧的所述区域的所述归一化测序深度均有显著性差异,则所述融合基因为真。2.根据权利要求1所述的方法,其特征在于,所述归一化处理包括:对所述测序深度进行测序数据量的归一化处理,获得每百万条数据量测序深度;再对所述每百万条数据量测序深度进行测序效率的归一化处理,获得所述归一化测序深度。3.根据权利要求2所述的方法,其特征在于,所述测序数据量的归一化处理包括:获得所述RNA测序数据的测序数据量,根据所述测序深度和所述测序数据量计算获得所述每百万条数据量测序深度,所述每百万条数据量测序深度 = 所述测序深度
ꢀ÷ꢀ
所述测序数据量
ꢀ×ꢀ
106。4.根据权利要求2所述的方法,其特征在于,所述测序效率的归一化处理包括:利用归一化因子对所述每百万条数据量测序深度进行所述测序效率的归一化处理,获得所述归一化测序深度,所述归一化因子包括中位数归一化因子和/或平均数归一化因子,所述归一化测序深度包括中位数归一化测序深度和/或平均数归一化测序深度,所述中位数归一化测序深度 = 所述每百万条数据量的测序深度
ꢀ×ꢀ
所述中位数归一化因子,所述平均数归一化测序深度 = 所述每百万条数据量的测序深度
ꢀ×ꢀ
所述平均数归一化因子。5.根据权利要求4所述的方法,其特征在于,所述归一化因子的计算方法包括:d1)对同一样本进行多次RNA捕获测序,并将测序结果分别与所述参考基因组比对,获得多个RNA参考数据;d2)对于每个所述RNA参考数据,计算每个所述区域在所述RNA参考数据中的测序深度;d3)统计每个所述区域在多个所述RNA参考数据中的所述测序深度,获得每个所述区域的所述测序深度的中位数和/或平均数,计算每个所述区域的中位数归一化因子和/或所述平均数归一化因子,所述中位数归一化因子 = 100
÷ꢀ
所述中位数,所述平均数归一化因子 = 100
÷ꢀ
所述平均数。6.根据权利要求1所述的方法,其特征在于,所述碱基长度为8
‑
20 bp。7.一种判断融合基因真实性的电子装置,其特征在于,所述电子装置包括序列比对单元、区域拆分单元、测序深度计算单元、归一化处理单元和显著性判断单元;其中,所述序列比对单元,用于将RNA测序数据与参考基因组比对,获得测序比对文件;
所述区域拆分单元,用于将所述融合基因的原始基因的外显子区域根据碱基长度进行拆分,获得多个所述碱基长度相同的区域;所述测序深度计算单元,用于计算每个所述区域在所述测序比对文件上的...
【专利技术属性】
技术研发人员:于洋,
申请(专利权)人:北京诺禾致源科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。