基于神经网络实现的方法和系统技术方案

技术编号:31027084 阅读:14 留言:0更新日期:2021-11-30 03:30
所公开的技术包括减少处理氨基酸序列和对应的位置频率矩阵(PFM)的神经网络实现的模型的过拟合的系统和方法。所述系统生成标记为良性的补充训练样例序列对,所述补充训练样例序列对包括按顺序排列的起始位置、目标氨基酸位置和结束位置。补充序列对补充了致病性或良性错义训练样例序列对。其在参考氨基酸序列和替代氨基酸序列中具有相同的氨基酸。所述系统包括用每个补充序列对输入补充训练位置频率矩阵(PFM)的逻辑,所述补充训练PFM与在匹配的起始和结束位置的所述良性或致病性错义训练样例序列对的PFM相同。系统包括通过补充训练样例PFM包含在将训练数据中来削弱在训练所述神经网络实现的模型期间所述训练PFM的训练影响的逻辑。响的逻辑。响的逻辑。

【技术实现步骤摘要】
基于神经网络实现的方法和系统
[0001]本申请是申请号为201980003263.9、名称为“基于神经网络实现的方法和系统”的中国专利技术专利申请的分案申请。
[0002]优先权申请
[0003]本申请要求2019年5月8日提交的标题为“DEEP LEARNING

BASED TECHNIQUES FOR PRE

TRAINING DEEP CONVOLUTIONAL NEURAL NETWORKS”的美国部分继续专利No.16/407,149(代理人案卷号:ILLM 1010

1/IP

1734

US)的优先权,它是以下同时于2018年10月15日提交的三个PCT申请和三个美国非临时申请的继续专利申请并要求这些申请的优先权,即:(1)于2018年10月15日提交的标题为“DEEP LEARNING

BASED TECHNIQUES FOR TRAINING DEEP CONVOLUTIONAL NEURAL NETWORKS”的PCT专利申请PCT/US2018/055840(代理人案卷号ILLM 1000

8/IP

1611

PCT);(2)于2018年10月15日提交的标题为“DEEP CONVOLUTIONAL NEURAL NETWORKS FOR VARIANT CLASSIFICATION”的PCT专利申请PCT/US2018/055878(代理案卷号:ILLM 1000

9/IP

1612

PCT);(3)于2018年10月15日提交的标题为“SEMI

SUPERVISED LEARNING FOR TRAINING AN ENSEMBLE OF DEEP CONVOLUTIONAL NEURAL NETWORKS”的PCT专利申请PCT/US2018/055881(代理人案卷号:ILLM 1000

10/IP

1613

PCT);(4)2018年10月15日提交的标题为“DEEP LEARNING

BASED TECHNIQUES FOR TRAINING DEEP CONVOLUTIONAL NEURAL NETWORKS”的美国临时专利申请No.16/160,903(律师案卷号:ILLM1000

5/IP

1611

US);(5)2018年10月15日提交的标题为“DEEP CONVOLUTIONAL NEURAL NETWORKS FOR VARIANT CLASSIFICATION”的美国非临时专利申请No.16/160,986(代理人案卷号:ILLM 1000

6/IP

1612

US);以及(6)2018年10月15日提交的标题为“SEMI

SUPERVISED LEARNING FOR TRAINING AN ENSEMBLE OF DEEP CONVOLUTIONAL NEURAL NETWORKS”的美国非临时专利申请No.16/160,968(代理人案卷号:ILLM 1000

7/IP

1613

US)。所有三个PCT申请和三个美国非临时申请都要求以下列出的四个美国临时申请的优先权和/或权益。
[0004]2017年10月16日提交的标题为“TRAINING A DEEP PATHOGENICITY CLASSIFIER USING LARGE

SCALE BENIGN TRAINING DATA”的美国临时专利申请No.62/573,144(代理人案卷号:ILLM 1000

1/IP

1611

PRV)。
[0005]2017年10月16日提交的标题为“PATHOGENICITY CLASSIFIER BASED ON DEEP CONVOLUTIONAL NEURAL NETWORKS(CNNS)”的美国临时专利申请No.62/573,149(代理人案卷号:ILLM 1000

2/IP

1612

PRV)。
[0006]2017年10月16日提交的标题为“DEEP SEMI

SUPERVISED LEARNING THAT GENERATES LARGE

SCALE PATHOGENIC TRAINING DATA”的美国临时专利申请No.62/573,153(代理人案卷号:ILLM 1000

3/IP

1613

PRV)。
[0007]2017年11月7日提交的标题为“PATHOGENICITY CLASSIFICATION OF GENOMIC DATA USING DEEP CONVOLUTIONAL NEURAL NETWORKS(CNNs)”的美国临时专利申请No.62/582,898(代理人案卷号:ILLM 1000

4/IP

1618

PRV)。
[0008]并入本文的参考文献
OF DEEP CONVOLUTIONAL NEURAL NETWORKS”的美国非临时专利申请No.16/160,968(代理人案卷号ILLM1000

7/IP

1613

US)。
[0020]文献1

A.V.D.Oord,S.Dieleman,H.Zen,K.Simonyan,O.Vinyals,A.Graves,N.Kalchbrenner,A.Senior,and K.Kavukcuoglu,“WAVENET:AGENERATIVE MODEL FOR RAW AUDIO,”arXiv:1609.03499,2016;
[0021]文献2

S.Arik,M.Chrzanowski,A.Coates,G.Diamos,A.Gibiansky,Y.Kang,X.Li,J.Miller,A.Ng,J.Raiman,S.Sengupta and M.Shoeybi,“DEEP VOICE:REAL

TIME NEURAL TEXT

TO

SPEECH,”arXiv:1702.07825,2017;
[0022]文献3

F.Yu and V.Koltun,“MULT本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种系统,包括:致病性分类器,其被配置为:将输入映射到致病性分类,其中,所述输入包括补充有位置频率矩阵的序列对;以及削弱所述位置频率矩阵对所述致病性分类的影响。2.根据权利要求1所述的系统,还被配置为包括标记为良性的补充训练样例序列对,并且跨越起始位置通过靶氨基酸位置到达结束位置。3.根据权利要求2所述的系统,其中,每个补充序列对与错义训练样例序列对的起始位置和结束位置匹配。4.根据权利要求3所述的系统,其中,每个补充序列对在参考氨基酸序列和替代氨基酸序列中具有相同的氨基酸。5.根据权利要求4所述的系统,其中,每个补充序列对具有补充训练位置频率矩阵,所述补充训练位置频率矩阵与在匹配的起始位置和结束位置的错义训练样例的位置频率矩阵相同。6.根据权利要求5所述的系统,还被配置为在良性训练样例序列对、补充训练样例位置频率矩阵、错义训练样例序列对以及在匹配的起始位置和结束位置的错义的位置频率矩阵上训练所述致病性分类器。7.根据权利要求6所述的系统,其中,所述补充序列对与致病性错义训练样例序列对的起始位置和结束位置匹配。8.根据权利要求6所述的系统,其中,所述补充序列对与良性错义训练样例序列对的起始位置和结束位置匹配。9.根据权利要求6所述的系统,还被配置为对所述致病性分类器...

【专利技术属性】
技术研发人员:H
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1