基于人工智能的表观遗传制造技术

技术编号:33239810 阅读:10 留言:0更新日期:2022-04-27 17:43
本公开提供了一种基于人工智能的系统,该基于人工智能的系统包括输入准备模块,该输入准备模块访问序列数据库并且生成输入碱基序列。该输入碱基序列包括具有靶向碱基的靶向碱基序列,其中该靶向碱基序列侧接具有下游上下文碱基的右端碱基序列,和具有上游上下文碱基的左端碱基序列。序列对序列模型处理输入碱基序列并且生成输入碱基序列的替代表示。输出模块处理输入碱基序列的该替代表示并且针对靶向碱基序列中的靶向碱基中的每个靶向碱基产生至少一个每碱基输出。该每碱基输出针对对应靶向碱基指定多个表观遗传轨迹的信号水平。靶向碱基指定多个表观遗传轨迹的信号水平。靶向碱基指定多个表观遗传轨迹的信号水平。

【技术实现步骤摘要】
【国外来华专利技术】NEURAL TEXT

TO

SPEECH”,arXiv:1702.07825,2017年;
[0013]文档3—F.Yu和V.Koltun,“MULTI

SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS”,arXiv:1511.07122,2016年;
[0014]文档4—K.He、X.Zhang、S.Ren和J.Sun,“DEEP RESIDUAL LEARNING FOR IMAGE RECOGNITION”,arXiv:1512.03385,2015年;
[0015]文档5—R.K.Srivastava、K.Greff和J.Schmidhuber,“HIGHWAY NETWORKS”,arXiv:1505.00387,2015年;
[0016]文档6—G.Huang、Z.Liu、L.van der Maaten和K.Q.Weinberger,“DENSELY CONNECTED CONVOLUTIONAL NETWORKS”,arXiv:1608.06993,2017年;
[0017]文档7—C.Szegedy、W.Liu、Y.Jia、P.Sermanet、S.Reed、D.Anguelov、D.Erhan、V.Vanhoucke和A.Rabinovich,“GOING DEEPER WITH CONVOLUTIONS”,arXiv:1409.4842,2014年;
[0018]文档8—S.Ioffe和C.Szegedy,“BATCH NORMALIZATION:ACCELERATING DEEP NETWORK TRAINING BY REDUCING INTERNAL COVARIATE SHIFT”,arXiv:1502.03167,2015年;
[0019]文档9—J.M.Wolterink、T.Leiner、M.A.Viergever和I.“DILATED CONVOLUTIONAL NEURAL NETWORKS FOR CARDIOVASCULAR MR SEGMENTATION IN CONGENITAL HEART DISEASE”,arXiv:1704.03669,2017年;
[0020]文档10—L.C.Piqueras,“AUTOREGRESSIVE MODEL BASED ON ADEEP CONVOLUTIONAL NEURAL NETWORK FOR AUDIO GENERATION”,坦佩雷理工大学,2016年;
[0021]文档11—J.Wu,“Introduction to Convolutional Neural Networks”,南京大学,2017年;
[0022]文档12—I.J.Goodfellow、D.Warde

Farley、M.Mirza、A.Courville和Y.Bengio,“CONVOLUTIONAL NETWORKS”,Deep Learning,MIT出版社,2016年;和
[0023]文档13—J.Gu、Z.Wang、J.Kuen、L.Ma、A.Shahroudy、B.Shuai、T.Liu、X.Wang和G.Wang,“RECENT ADVANCES IN CONVOLUTIONAL NEURAL NETWORKS”,arXiv:1512.07108,2017年。
[0024]文档1描述了深度卷积神经网络架构,该深度卷积神经网络架构使用带有具有相同卷积窗尺寸的卷积滤波器的残差块组、批量归一化层、修正线性单元(缩写为ReLU)层、维度变更层、具有指数增长的空洞卷积速率的空洞卷积层、跳跃连接和softmax分类层来接受输入序列以及产生对输入序列中的条目进行评分的输出序列。所公开的技术使用文档1中所述的神经网络部件和参数。在一个具体实施中,所公开的技术修改文档1中所述的神经网络部件的参数。例如,与文档1不同,所公开的技术中的空洞卷积速率从较低残差块组非指数进展到较高残差块组。在另一示例中,与文档1不同,所公开的技术中的卷积窗尺寸在残差块组之间不同。
[0025]文档2描述了文档1中所述的深度卷积神经网络架构的细节。
[0026]文档3描述了由所公开的技术使用的空洞卷积。如本文所用,空洞卷积也被称为“扩张卷积”。空洞/扩张卷积允许具有很少可训练参数的大感受场。空洞/扩张卷积是其中通过以特定步长(也被称为空洞卷积速率或扩张因子)跳过输入值来在比内核长度大的区
域上应用该内核的卷积。空洞/扩张卷积在卷积滤波器/内核的元素之间添加间距,使得在执行卷积运算时,考虑较大间隔的邻近输入条目(例如,核苷酸、氨基酸)。这使得能够在输入中结合长程情境依赖性。空洞卷积节省了部分卷积计算以在处理相邻核苷酸时重新使用。
[0027]文档4描述了由所公开的技术使用的残差块和残差连接。
[0028]文档5描述了由所公开的技术使用的跳跃连接。如本文所用,跳跃连接也称为“高速公路网络”。
[0029]文档6描述了由所公开的技术使用的密集连接的卷积网络架构。
[0030]文档7描述了由所公开的技术使用的维度变更卷积层和基于模块的处理流水线。维度变更卷积的一个示例是1
×
1卷积。
[0031]文档8描述了由所公开的技术使用的批量归一化层。
[0032]文档9也描述了由所公开的技术使用的空洞/扩张卷积。
[0033]文档10描述了可以由所公开的技术使用的深度神经网络的各种架构,包括卷积神经网络、深度卷积神经网络和具有空洞/扩张卷积的深度卷积神经网络。
[0034]文档11描述了卷积神经网络的细节,该卷积神经网络可以由所公开的技术使用,包括用于训练具有子采样层(例如,池化)和全连接层的卷积神经网络的算法。
[0035]文档12描述了可以由所公开的技术使用的各种卷积运算的细节。
[0036]文档13描述了可以由所公开的技术使用的卷积神经网络的各种架构。


[0037]本专利技术所公开的技术涉及人工智能类型计算机和数字数据处理系统以及对应数据处理方法和用于仿真智能的产品(即,基于知识的系统、推断系统和知识采集系统);并且包括用于不确定性推断的系统(例如,模糊逻辑系统)、自适应系统、机器学习系统和人工神经网络。具体地,所公开的技术涉及使用基于深度学习的技术来训练深度卷积神经网络。

技术介绍

[0038]本部分中讨论的主题不应仅因为在本部分中有提及就被认为是现有技术。类似地,在本部分中提及的或与作为
技术介绍
提供的主题相关联的问题不应被认为先前在现有技术中已被认识到。本部分中的主题仅表示不同的方法,这些方法本身也可对应于受权利要求书保护的技术的具体实施。
[0039]机器学习
[0040]在机器学习中,使用输入变量来预测输出变量。输入变量通常被称为特征并且由X=(X1,X2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种基于人工智能的系统,所述基于人工智能的系统包括:输入准备模块,所述输入准备模块访问序列数据库并且生成输入碱基序列,其中所述输入碱基序列包括(i)靶向碱基序列,所述靶向碱基序列具有靶向碱基,其中所述靶向碱基序列侧接(ii)右端碱基序列,所述右端碱基序列具有下游上下文碱基,和(iii)左端碱基序列,所述左端碱基序列具有上游上下文碱基;序列对序列模型,所述序列对序列模型处理所述输入碱基序列并且生成所述输入碱基序列的替代表示;和输出模块,所述输出模块处理所述输入碱基序列的所述替代表示并且针对所述靶向碱基序列中的所述靶向碱基中的每个靶向碱基产生至少一个每碱基输出;其中所述每碱基输出针对对应靶向碱基指定多个表观遗传轨迹的信号水平。2.根据权利要求1所述的基于人工智能的系统,其中所述每碱基输出使用连续值来指定所述多个表观遗传轨迹的所述信号水平。3.根据权利要求1所述的基于人工智能的系统,其中所述输出模块还包括多个每轨处理器,其中每个每轨处理器对应于所述多个表观遗传轨迹中的相应表观遗传轨迹,并且产生对应表观遗传轨迹的信号水平。4.根据权利要求3所述的基于人工智能的系统,其中所述多个每轨处理器中的每个每轨处理器处理所述输入碱基序列的所述替代表示,生成对特定每轨处理器具有特异性的另外替代表示,并且基于所述另外替代表示产生所述对应表观遗传轨迹的所述信号水平。5.根据权利要求4所述的基于人工智能的系统,其中每个每轨处理器还包括至少一个残差块和线性模块和/或修正线性单元(ReLU)模块,并且其中所述残差块生成所述另外替代表示和所述线性模块和/或所述ReLU模块处理所述另外替代表示并且产生所述对应表观遗传轨迹的所述信号水平。6.根据权利要求3所述的基于人工智能的系统,其中所述多个每轨处理器中的每个每轨处理器处理所述输入碱基序列的所述替代表示,并且基于所述替代表示产生所述对应表观遗传轨迹的所述信号水平。7.根据权利要求6所述的基于人工智能的系统,其中每个每轨处理器还包括线性模块和/或ReLU模块。8.根据权利要求1所述的基于人工智能的系统,其中所述多个表观遗传轨迹包括脱氧核糖核酸(DNA)甲基化改变(例如,CpG)、组蛋白修饰、非编码核糖核酸(ncRNA)表达和染色质结构改变(例如,核小体定位)。9.根据权利要求1所述的基于人工智能的系统,其中所述多个表观遗传轨迹包括脱氧核糖核酸酶(DNase)轨迹。10.根据权利要求1所述的基于人工智能的系统,其中所述多个表观遗传轨迹包括组蛋白3赖氨酸27乙酰化(H3K27ac)轨迹。11.根据权利要求1所述的基于人工智能的系统,其中所述序列对序列模型是卷积神经网络。12.根据权利要求11所述的基于人工智能的系统,其中所述卷积神经网络还包括残差块组。
13.根据权利要求12所述的基于人工智能的系统,其中每...

【专利技术属性】
技术研发人员:S
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1