【技术实现步骤摘要】
【国外来华专利技术】基于深度学习的剪接位点分类附录附录包括专利技术人撰写的论文中列出的潜在相关参考文献的书目。本文的主题涵盖在本申请要求其优先权/权益的美国临时专利申请中。这些参考资料可由法律顾问根据要求提供,也可以经由全球档案查阅。优先权申请本申请要求以下的优先权或权益:由KishoreJaganathan、Kai-HowFarh、SofiaKyriazopoulouPanagiotopoulou和JeremyFrancisMcRae于2017年10月16日提交的标题为“基于深度学习的剪接位点分类”的美国临时专利申请No.62/573,125(代理人案卷号:ILLM1001-1/IP-1610-PRV);由KishoreJaganathan、Kai-HowFarh、SofiaKyriazopoulouPanagiotopoulou和JeremyFrancisMcRae于2017年10月16日提交的标题为“基于深度学习的异常剪接检测”的美国临时专利申请No.62/573,131(代理人案卷No.ILLM1001-2/IP-1614-PRV);由Kisho ...
【技术保护点】
1.一种异常剪接检测器,包括:/n与存储器耦合的并行操作的多个处理器;/n在所述多个处理器上运行的训练过的空洞卷积神经网络(缩写为ACNN),所述ACNN/n对输入序列中的靶核苷酸进行分类,并为每个靶核苷酸是供体剪接位点、受体剪接位点或非剪接位点的可能性分配剪接位点得分,其中所述输入序列包含至少801个核苷酸并且每个靶核苷酸在每一侧上由至少400个核苷酸侧接;以及/n在所述多个处理器中至少之一上运行的分类器,所述分类器/n通过所述ACNN处理参考序列和变体序列以产生剪接位点得分,以给出所述参考序列和所述变体序列中的每个靶核苷酸是供体剪接位点、受体剪接位点或非剪接位点的可能性 ...
【技术特征摘要】
【国外来华专利技术】20171016 US 62/573125;20171016 US 62/573131;2017101.一种异常剪接检测器,包括:
与存储器耦合的并行操作的多个处理器;
在所述多个处理器上运行的训练过的空洞卷积神经网络(缩写为ACNN),所述ACNN
对输入序列中的靶核苷酸进行分类,并为每个靶核苷酸是供体剪接位点、受体剪接位点或非剪接位点的可能性分配剪接位点得分,其中所述输入序列包含至少801个核苷酸并且每个靶核苷酸在每一侧上由至少400个核苷酸侧接;以及
在所述多个处理器中至少之一上运行的分类器,所述分类器
通过所述ACNN处理参考序列和变体序列以产生剪接位点得分,以给出所述参考序列和所述变体序列中的每个靶核苷酸是供体剪接位点、受体剪接位点或非剪接位点的可能性,其中所述参考序列和所述变体序列均具有至少101个靶核苷酸,并且每个靶核苷酸在每一侧上由至少400个核苷酸侧接,以及
根据所述参考序列和所述变体序列中所述靶核苷酸的剪接位点得分的差异,确定产生所述变体序列的变体是否引起异常剪接并因此是致病性的。
2.根据权利要求1所述的异常剪接检测器,其中,所述剪接位点得分的差异是在所述参考序列和所述变体序列中的靶核苷酸之间按位置确定的。
3.根据权利要求1-2中任一项所述的异常剪接检测器,其中,对于至少一个靶核苷酸位置,所述剪接位点得分的总体最大差异高于预定阈值,进一步被配置为将所述变体分类为引起异常剪接并因此是致病性的。
4.根据权利要求1-3中任一项所述的异常剪接检测器,其中,对于至少一个靶核苷酸位置,所述剪接位点得分的全局最大差异低于预定阈值,进一步被配置为将所述变体分类为不引起异常剪接并因此是良性的。
5.根据权利要求1-4中任一项所述的异常剪接检测器,其中,所述阈值由以下确定:
对于多个候选阈值,
处理由良性常见变体产生的第一组参考和变体序列对,以产生第一组异常剪接检测;以及
处理由致病性罕见变体产生的第二组参考和变体序列对,以产生第二组异常剪接检测;以及
选择至少一个阈值以供所述分类器使用,所述阈值使所述第二组中的异常剪接检测的计数最大化,并使所述第一组中的异常剪接检测的计数最小化。
6.根据权利要求1-5中任一项所述的异常剪接检测器,其中,所述参考序列和所述变体序列均具有至少101个靶核苷酸,并且每个靶核苷酸在每一侧上由至少5000个核苷酸侧接。
7.根据权利要求1-6中任一项所述的异常剪接检测器,其中,所述参考序列中所述靶核苷酸的剪接位点得分被编码在所述ACNN的第一输出中,并且所述变体序列中所述靶核苷酸的剪接位点得分被编码在所述ACNN的第二输出中。
8.根据权利要求1-7中任一项所述的异常剪接检测器,其中,所述第一输出被编码为第一101×3矩阵,并且所述第二输出被编码为第二101×3矩阵。
9.根据权利要求1-8中任一项所述的异常剪接检测器,其中,所述第一101×3矩阵中的每一行唯一地表示剪接位点得分,以给出所述参考序列中的靶核苷酸是供体剪接位点、受体剪接位点或非剪接位点的可能性。
10.根据权利要求1-9中任一项所述的异常剪接检测器,其中,所述第二101×3矩阵中的每一行唯一地表示剪接位点得分,以给出所述变体序列中的靶核苷酸是供体剪接位点、受体剪接位点或非剪接位点的可能性。
11.根据权利要求1-10中任一项所述的异常剪接检测器,其中,将所述第一101×3矩阵和所述第二101×3矩阵的每一行中的剪接位点得分指数式地进行归一化并求和为一。
12.根据权利要求1-11中任一项所述的异常剪接检测器,其中,所述分类器执行所述第一101×3矩阵和所述第二101×3矩阵的行到行比较,并且逐行地确定剪接位点得分分布的变化。
13.根据权利要求1-12中任一项所述的异常剪接检测器,其中,对于所述行到行比较的至少一个实例,所述分布的变化高于预定阈值,进一步被配置为将所述变体分类为引起异常剪接并因此是致病性的。
14.根据权利要求1-13中任一项所述的异常剪接检测器,其中,所述参考序列和所述变体序列是单热编码的。
15.根据权利要求1-14中任一项所述的异常剪接检测器,进一步被配置为实施每基因富集分析,其通过以下确定已经确定引起异常剪接的变体的致病性:
对于从具有遗传疾病的个体的群组中采样的特定基因,
应用训练过的ACNN以识别所述特定基因中引起异常剪接的候选变体;
基于观察到的所述候选变体的三核苷酸突变率的和,以及所述和与传输数和群组大小的乘积确定所述特定基因的突变的基线数;
应用训练过的ACNN来识别所述特定基因中引起异常剪接的新生变体;以及
将所述突变的基线数与所述新生变体的数量进行比较,并基于所述比较的输出确定所述特定基因与遗传疾病相关以及所述新生变体是致病性的。
16.根据权利要求1-15中任一项所述的异常剪接检测器,其进一步被配置为使用产生p值作为所述输出的统计测试来执行所述比较。
17.根据权利要求1-16中任一项所述的异常剪接检测器,其进一步被配置为将所述突变的基线数与所述新生变体的数量进行比较,并且基于所述比较的输出确定所述特定基因与所述遗传疾病不相关并且所述新生变体是良性的。
18.根据权利要求1-17中任一项所述的异常剪接检测器,其中,所述遗传疾病是自闭症谱系障碍(缩写为ASD)。
19.根据权利要求1-18中任一项所述的异常剪接检测器,其中,所述遗传疾病是发育迟缓障碍(缩写为DDD)。
20.根据权利要求1-19中任一项所述的异常剪接检测器,其中,所述候选变体中的至少一些是蛋白质截断变体。
21.根据权利要求1-20中任一项所述的异常剪接检测器,其中,所述候选变体中的至少一些是错义变体。
22.根据权利要求1-21中任一项所述的异常剪接检测器,其进一步被配置为实施全基因组富集分析,所述全基因组富集分析通过以下确定已经确定为引起异常剪接的变体的致病性:
应用训练过的ACNN来识别第一组新生变体,其导致从健康个体的群组中采样的多个基因中的异常剪接;
应用所述训练过的ACNN来识别第二组新生变体,其导致从具有遗传疾病的个体的群组中采样的多个基因中的异常剪接;以及
比较所述第一组和所述第二组的各自的计数,并基于所述比较的输出确定所述第二组新生变体富集于具有遗传疾病的个体的群组中并因此是致病性的。
23.根据权利要求1-22中任一项所述的异常剪接检测器,进一步被配置为使用产生p值作为所述输出的统计测试来执行所...
【专利技术属性】
技术研发人员:K·贾加纳坦,KH·法尔,S·卡拉佐普罗潘吉欧托普卢,J·F·麦克雷,
申请(专利权)人:因美纳有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。