【技术实现步骤摘要】
【国外来华专利技术】deep neural networks.Nat.Genet.
,
50,1161
‑
1170(2018)
;
[0012]Jaganathan,K.
等人,
Predicting splicing from primary sequence with deep learning.Cell 176,535
‑
548(2019)
;
[0013]2017
年
10
月
16
日提交的名称为“TRAINING A DEEP PATHOGENICITY CLASSIFIER USING LARGE
‑
SCALE BENIGN TRAINING DATA”的美国专利申请号
62/573,144(
代理人案卷号
ILLM 1000
‑
1/IP
‑
1611
‑
PRV)
;
[0014]2017
年
10
月
16
日提交的名称为“PATHOGENICITY CLASSIFIER BASED ON DEEP CONVOLUTIONAL NEURAL NETWORKS(CNNs)”的美国专利申请号
62/573,149(
代理人案卷号
ILLM 1000
‑
2/IP
‑
1612
‑
PRV)
;
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种系统,包括:存储器,所述存储器存储蛋白质中多个氨基酸的氨基酸式距离通道,其中所述氨基酸式距离通道中的每个氨基酸式距离通道具有多个体素中的体素的体素式距离值,并且其中所述体素式距离值指定从所述多个体素中的对应体素到所述多个氨基酸中的对应氨基酸的原子的距离;以及致病性测定引擎,所述致病性测定引擎被配置为处理包括所述氨基酸式距离通道和由变体表达的所述蛋白质的替代性等位基因氨基酸的张量,以及至少部分地基于所述张量来确定所述变体的致病性
。2.
根据权利要求1所述的系统,还包括距离通道生成器,所述距离通道生成器将所述体素的体素网格中心定位在所述氨基酸的相应残基的
α
‑
碳原子上
。3.
根据权利要求2所述的系统,其中所述距离通道生成器将所述体素网格中心定位在位于所述蛋白质中的变体氨基酸处的特定氨基酸残基的
α
‑
碳原子上
。4.
根据权利要求1至3中任一项所述的系统,进一步被配置为通过将所述特定氨基酸之前的那些氨基酸的体素式距离值乘以方向性参数,来在所述张量中编码所述氨基酸的方向性和所述特定氨基酸的位置
。5.
根据权利要求1至4中任一项所述的系统,其中所述距离是从所述体素网格中的对应体素中心到所述对应氨基酸的最接近原子的最接近原子距离
。6.
根据权利要求5所述的系统,其中所述最接近原子距离是欧几里得距离
。7.
根据权利要求5或6所述的系统,其中所述最接近原子距离通过将所述欧几里得距离除以最大最接近原子距离来归一化
。8.
根据权利要求1至7中任一项所述的系统,其中所述氨基酸具有
α
‑
碳原子,其中所述距离是从所述对应体素中心到所述对应氨基酸的最接近
α
‑
碳原子的最接近
α
‑
碳原子距离
。9.
根据权利要求1至8中任一项所述的系统,其中所述氨基酸具有
β
‑
碳原子,其中所述距离是从所述对应体素中心到所述对应氨基酸的最接近
β
‑
碳原子的最接近
β
‑
碳原子距离
。10.
根据权利要求1至9中任一项所述的系统,其中所述氨基酸具有主链原子,其中所述距离是从所述对应体素中心到所述对应氨基酸的最接近主链原子的最接近主链原子距离
。11.
根据权利要求1至
10
中任一项所述的系统,其中所述氨基酸具有侧链原子,其中所述距离是从所述对应体素中心到所述对应氨基酸的最接近侧链原子的最接近侧链原子距离
。12.
根据权利要求1至
11
中任一项所述的系统,进一步被配置为在所述张量中编码最接近原子通道,所述最接近原子通道指定从每个体素到最接近原子的距离,其中选择所述最接近原子而不考虑所述氨基酸和所述氨基酸的原子元素
。13.
根据权利要求
12
所述的系统,其中所述距离是欧几里得距离
。14.
根据权利要求
12
或
13
所述的系统,其中所述距离通过将所述欧几里得距离除以最大距离来归一化
。15.
根据权利要求
12
至
14
中任一项所述的系统,其中所述氨基酸包括非标准氨基酸
。16.
根据权利要求1至
15
中任一项所述的系统,其中所述张量还包括指定未在体素中心
的预定义半径内找到的原子的缺席原子通道,其中所述缺席原子通道是独热编码的
。17.
根据权...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。