针对基因结构重排预测功能融合的方法、设备和介质技术

技术编号:38036981 阅读:13 留言:0更新日期:2023-06-30 11:03
本发明专利技术涉及一种用于针对基因结构重排预测功能融合的方法、设备和介质。该方法包括:基于测序数据计算基因结构重排的断点;获取基因结构重排的断点所对应的转录的边缘剩余密码子,以便计算断点重接处的密码子三联状态信息;确定基因结构重排所涉基因是否包括激酶结构域;响应于确定基因结构重排所涉基因包括激酶结构域,获得对应激酶结构域的基因组范围,以便确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息;基于包含状态信息和/或断点重接处的密码子三联状态信息,针对基因结构重排预测功能融合状态。本发明专利技术能够实现针对NGS所检测出的基因结构重排准确预测功能融合。确预测功能融合。确预测功能融合。

【技术实现步骤摘要】
针对基因结构重排预测功能融合的方法、设备和介质


[0001]本专利技术总体上涉及生物信息的处理,并且具体地,涉及用于针对基因结构重排预测功能融合的方法、计算设备和计算机存储介质。

技术介绍

[0002]当前二代基因测序(Next

Generation Sequencing,NGS)检测可以检测出基因的结构重排。并且,当前也有很多针对功能融合的小分子抑制剂药物被(C)FDA批准,例如而不限于,针对ALK、RET、ROS1融合的抑制剂在非小细胞肺癌的治疗中被批准。因此,如何基于NGS检测出的基因的结构重排准确预测功能融合对于靶药的治疗选择和疗效尤为重要。
[0003]当前尚无公开的算法能够实现针对NGS所检测出的基因结构重排准确预测功能融合。

技术实现思路

[0004]本专利技术提供一种用于针对基因结构重排预测功能融合的方法、计算设备和计算机存储介质,能够实现针对NGS所检测出的基因结构重排准确预测功能融合。
[0005]根据本专利技术的第一方面,提供了一种用于针对基因结构重排预测功能融合的方法。该方法包括:基于测序数据计算基因结构重排的断点;获取基因结构重排的断点所对应的转录的边缘剩余密码子,以便计算断点重接处的密码子三联状态信息;确定基因结构重排所涉基因是否包括激酶结构域;响应于确定基因结构重排所涉基因包括激酶结构域,获得对应激酶结构域的基因组范围,以便确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息;以及基于包含状态信息和/或断点重接处的密码子三联状态信息,针对基因结构重排预测功能融合状态。
[0006]根据本专利技术的第二方面,还提供了一种计算设备,该设备包括:存储器,被配置为存储一个或多个计算机程序;以及处理器,耦合至存储器并且被配置为执行一个或多个程序使装置执行本专利技术的第一方面的方法。
[0007]根据本专利技术的第三方面,还提供了一种非瞬态计算机可读存储介质。该非瞬态计算机可读存储介质上存储有机器可执行指令,该机器可执行指令在被执行时使机器执行本专利技术的第一方面的方法。
[0008]在一些实施例中,针对基因结构重排预测功能融合状态包括:确定预定条件是否满足,预定条件包括以下至少一项:断点重接处的密码子三联状态信息指示非移码;包含状态信息指示新嵌合转录本包含激酶结构域;以及包含状态信息指示新嵌合转录本部分包含激酶结构域;如果确定预定条件满足,确定基因结构重排为功能融合。
[0009]在一些实施例中,确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息包括:计算基因结构重排的断点相对于激酶结构域的区域,以便确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息,包含状态信息包括以下一项:新嵌合转录本包含激酶结构域;新嵌合转录本部分包含激酶结构域;或者新嵌合
转录本不包含激酶结构域部分。
[0010]在一些实施例中,还包括:计算基因结构重排的断点相对于激酶结构域的区域包括:自NCBI蛋白质保守结构域数据库获取所有结构域所对应的Pdot位置区域;基于指示激酶结构域的标识,获取激酶结构域所对应的Pdot位置区域;将所获取的激酶结构域所对应的Pdot位置区域转换为基因组位置区域;以及计算基因结构重排的断点位置相对于经转换后的基因组位置区域,以便确定基因结构重排的断点相对于激酶结构域的区域。
[0011]在一些实施例中,计算断点重接处的密码子三联状态信息包括:如果是负链转录,将所获取的外显子的剩余密码子状态逆排序,所获取的外显子的剩余密码子状态是来源于UCSC基因组浏览器数据库的人类参考基因组HG19的参考基因组信息文件的第16列信息;将经由逆排序的外显子的剩余密码子状态的第一个为0的密码子状态去除;如果断点表示为直接基因结构形式并且是负链转录且作为3

一端,获取断点重接处的前一密码子的状态信息的互补状态信息,以用于计算断点重接处的密码子三联状态信息;以及如果断点表示为直接基因结构形式并且是负链转录且作为5

一端,获取断点重接处的对应密码子的状态信息,以用于计算断点重接处的密码子三联状态信息。
[0012]在一些实施例中,计算断点重接处的密码子三联状态信息包括:如果是正链转录,将所获取的外显子的剩余密码子状态的第一个为0的密码子状态去除;如果断点表示为直接基因结构形式并且是正链转录且作为3

一端,获取断点重接处的前一密码子的状态信息的互补状态信息,以用于计算断点重接处的密码子三联状态信息;以及如果断点表示为直接基因结构形式并且是正链转录且作为5

一端,获取断点重接处的对应密码子的状态信息,以用于计算断点重接处的密码子三联状态信息。
[0013]在一些实施例中,在将所获取的外显子的剩余密码子状态的第一个为0的密码子状态去除之后,用于针对基因结构重排预测功能融合的方法还包括:如果断点表示为基因组位置形式并且是正链转录且作为3

一端,获取断点重接处的状态信息的互补状态信息,以用于计算断点重接处的密码子三联状态信息;以及如果断点表示为基因组位置形式并且是正链转录且作为5

一端,获取断点重接处的对应密码子的状态信息,以用于计算断点重接处的密码子三联状态信息。
[0014]在一些实施例中,确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息包括:如果基因结构重排的断点位置处于激酶结构域的起始位置和终止位置之间,确定新嵌合转录本部分包含激酶结构域;如果以下任一项满足,确定新嵌合转录本不包含激酶结构域:正链转录且作为5

一端并且断点位置小于激酶结构域的起始位置;或者正链转录且作为3

一端并且断点位置大于激酶结构域的终止位置;如果以下任一项满足,确定新嵌合转录本包含激酶结构域:正链转录且作为5

一端并且断点位置大于激酶结构域的终止位置;或者正链转录且作为3

一端并且断点位置小于激酶结构域的起始位置。
[0015]在一些实施例中,确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息包括:如果以下任一项满足,确定新嵌合转录本不包含激酶结构域:负链转录且作为5

一端并且断点位置大于激酶结构域的终止位置;或者负链转录且作为3

一端并且断点位置小于激酶结构域的起始位置;如果以下任一项满足,确定新嵌合转录本包含激酶结构域:负链转录且作为5

一端并且断点位置小于激酶结构域的起始位置;或者负链转录且作为3

一端并且断点位置大于激酶结构域的终止位置。
[0016]在一些实施例中,用于针对基因结构重排预测功能融合的方法还包括:获取多个预定数据库中的基因融合信息,以便确定预定基因融合集合;确定所计算的基因结构重排是否属于预定基因融合集合;以及响应于确定基因结构重排所涉基因属于预定基因融合集合,确定基因结构重排为功本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于针对基因结构重排预测功能融合的方法,其特征在于,包括:基于测序数据计算基因结构重排的断点;获取基因结构重排的断点所对应的转录的边缘剩余密码子,以便计算断点重接处的密码子三联状态信息;确定基因结构重排所涉基因是否包括激酶结构域;响应于确定基因结构重排所涉基因包括激酶结构域,获得对应激酶结构域的基因组范围,以便确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息;基于包含状态信息和/或断点重接处的密码子三联状态信息,针对基因结构重排预测功能融合状态。2.根据权利要求1所述的方法,其特征在于,针对基因结构重排预测功能融合状态包括:确定预定条件是否满足,预定条件包括以下至少一项:断点重接处的密码子三联状态信息指示非移码;包含状态信息指示新嵌合转录本包含激酶结构域;以及包含状态信息指示新嵌合转录本部分包含激酶结构域;如果确定预定条件满足,确定基因结构重排为功能融合。3.根据权利要求1所述的方法,其特征在于,确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息包括:计算基因结构重排的断点相对于激酶结构域的区域,以便确定关于基因结构重排所形成的新嵌合转录本包含激酶结构域的包含状态信息,包含状态信息包括以下一项:新嵌合转录本包含激酶结构域;新嵌合转录本部分包含激酶结构域;或者新嵌合转录本不包含激酶结构域部分。4.根据权利要求3所述的方法,其特征在于,计算基因结构重排的断点相对于激酶结构域的区域包括:自NCBI蛋白质保守结构域数据库获取所有结构域所对应的Pdot位置区域;基于指示激酶结构域的标识,获取激酶结构域所对应的Pdot位置区域;将所获取的激酶结构域所对应的Pdot位置区域转换为基因组位置区域;以及计算基因结构重排的断点位置相对于经转换后的基因组位置区域,以便确定基因结构重排的断点相对于激酶结构域的区域。5.根据权利要求1所述的方法,其特征在于,计算断点重接处的密码子三联状态信息包括:如果是负链转录,将所获取的外显子的剩余密码子状态逆排序,所获取的外显子的剩余密码子状态是来源于UCSC基因组浏览器数据库的人类参考基因组HG1 9的参考基因组信息文件的第16列信息;将经由逆排序的外显子的剩余密码子状态的第一个为0的密码子状态去除;如果断点表示为直接基因结构形式并且是负链转录且作为3

一端,获取断点重接处的前一密码子的状态信息的互补状态信息,以用于计算断点重接处的密码子三联状态信息;以及
如果断点表示为直接基因结构形式并且是负链转录且作为5

一端,获取断点重接处的对应密码子的状态信息,以用于计算断点重接处的密码子三联状态信息。6.根据权利要求5所述的方法,其特征在于,计算断点重接处的密码子三联状态信息包括:如果是正链转录,将所获取的外显子的剩余密码子状态的第一个为0的密码子状态去除;如果断点表示为直接基因结构形式并且是正链转录且作为3

一端,获取断点重接处的前一密码子的状态信息的互补状态信息,以用于计算断点重接处的密码子三联状态信息;以及如果断点表示为直接基因结构形式并且是正链转录且作为5

一端,获取断点重接处的对...

【专利技术属性】
技术研发人员:陈惠王凯庞菲
申请(专利权)人:上海至本医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1