用于碱基检出的基于区块位置和/或循环的权重集选择制造技术

技术编号:36861815 阅读:52 留言:0更新日期:2023-03-15 18:37
本发明专利技术公开了一种用于碱基检出的系统,该系统包括存储器,该存储器存储神经网络的拓扑结构、多个权重集和用于一系列感测循环的传感器数据。测序事件跨越该碱基检出操作经过感测循环子系列的时间进展和该碱基检出操作经过生物传感器上的位置的空间进展。可配置处理器被配置为:在可配置处理器上加载拓扑结构,根据感测循环的受试者子系列和/或生物传感器上的受试者位置来选择权重集,在处理元件上加载用于感测循环的受试者子系列和受试者位置的受试者传感器数据,使用所选择的权重集来配置拓扑结构,以及使神经网络处理受试者传感器数据以产生用于受试者子系列和受试者位置的碱基检出分类数据。基检出分类数据。基检出分类数据。

【技术实现步骤摘要】
【国外来华专利技术】INTELLIGENCE

BASED BASE CALLING”的美国临时专利申请号62/979,399(代理人案卷号ILLM 1030

1/IP

1982

PRV);
[0012]2020年3月20日提交的标题为“TRAINING DATA GENERATION FOR ARTIFICIAL INTELLIGENCE

BASED SEQUENCING”的美国非临时专利申请号16/825,987(代理人案卷号ILLM 1008

16/IP

1693

US);
[0013]2020年3月20日提交的标题为“ARTIFICIAL INTELLIGENCE

BASED GENERATION OF SEQUENCING METADATA”的美国非临时专利申请号16/825,991(代理人案卷号ILLM 1008

17/IP

1741

US);
[0014]2020年3月20日提交的标题为“ARTIFICIAL INTELLIGENCE

BASED BASE CALLING”的美国非临时专利申请号16/826,126(代理人案卷号ILLM 1008

18/IP

1744

US);
[0015]2020年3月20日提交的标题为“ARTIFICIAL INTELLIGENCE

BASED QUALITY SCORING”的美国非临时专利申请号16/826,134(代理人案卷号ILLM 1008

19/IP

1747

US);
[0016]2020年3月21日提交的标题为“ARTIFICIAL INTELLIGENCE

BASED SEQUENCING”的美国非临时专利申请号16/826,168(代理人案卷号ILLM 1008

20/IP

1752

US);
[0017]2020年5月14日提交的名称为“Systems and Devices for Characterization and Performance Analysis of Pixel

Based Sequencing”的美国非临时专利申请号16/874,599(代理人案卷号ILLM 1011

4/IP

1750

US);以及
[0018]2021年2月15日提交的名称为“HARDWARE EXECUTION AND ACCELERATION OF ARTIFICIAL INTELLIGENCE

BASED BASE CALLER”的美国非临时专利申请号17/176,147(代理人案卷号ILLM1020

2/IP

1866

US)。

技术介绍

[0019]本部分中讨论的主题不应仅因为在本部分中有提及就被认为是现有技术。类似地,在本部分中提及的或与作为
技术介绍
提供的主题相关联的问题不应被认为先前在现有技术中已被认识到。本部分中的主题仅表示不同的方法,这些方法本身也可对应于受权利要求书保护的技术的具体实施。
[0020]近年来,计算能力的快速提高使得深度卷积神经网络(CNN)在许多准确度显著提高的计算机视觉任务上取得了很大的成功。在推理阶段,许多应用需要以严格的功率消耗要求对一个图像进行低等待时间处理,这降低了图形处理单元(GPU)和其他通用平台的效率,通过定制专用于深度学习算法推理的数字电路,为特定的加速硬件(例如,现场可编程门阵列(FPGA))带来了机会。然而,由于大数据量、密集型计算、变化的算法结构和频繁的存储器访问,在便携式和嵌入式系统上部署CNN仍然具有挑战性。
[0021]由于卷积在CNN中贡献了大部分运算,因此卷积加速方案显著影响了硬件CNN加速器的效率和性能。卷积涉及具有沿内核和特征图滑动的四个循环级的乘法和累加(MAC)运算。第一循环级计算内核窗口内的像素的MAC。第二循环级跨不同的输入特征图累加MAC的乘积之和。在完成第一循环级和第二循环级之后,通过添加偏置来获得最终的输出像素。第三循环级在输入特征图内滑动内核窗口。第四循环级生成不同的输出特征图。
[0022]FPGA由于其(1)高度可重构性,(2)与专用集成电路(ASIC)相比开发时间更快,以
跟上CNN的快速发展,(3)良好的性能,以及(4)与GPU相比优越的能量效率,获得了越来越多的关注和普及,特别是在加速推理任务方面。FPGA的高性能和高效率可以通过合成针对特定计算定制的电路来实现,以利用定制的存储器系统直接处理数十亿次运算。例如,现代FPGA上的数百至数千个数字信号处理(DSP)块以高并行性支持核心卷积操作,例如,乘法和加法。外部片上存储器和片上处理引擎(PE)之间的专用数据缓冲器可被设计成通过在FPGA芯片上配置数十兆字节的片上块随机存取存储器(BRAM)来实现优选的数据流。
[0023]需要高效的数据流和CNN加速的硬件架构来最小化数据通信,同时最大化资源利用来实现高性能。因此有机会设计出在具有高性能、高效率和高度灵活性的加速硬件上加速各种CNN算法的推理过程的方法和框架。
附图说明
[0024]在附图中,在所有不同视图中,类似的参考符号通常是指类似的部件。另外,附图未必按比例绘制,而是重点说明所公开的技术的原理。在以下描述中,参考以下附图描述了所公开的技术的各种具体实施,其中:
[0025]图1示出了可以在各种实施方案中使用的生物传感器的横截面。
[0026]图2示出了在其区块中包含簇的流通池的一个具体实施。
[0027]图3示出了具有八个槽道的示例性流通池,并且还示出了一个区块及其簇和它们的周围背景的放大视图。
[0028]图4是用于分析来自测序系统的传感器数据(诸如碱基检出传感器输出)的系统的简化框图。
[0029]图5是示出了碱基检出操作的方面的简化图,该方面包括由主机处理器执行的运行时程序的功能。
[0030]图6是可配置处理器(诸如,图4的可配置处理器)的配置的简化图。
[0031]图7是可使用如本文所述配置的可配置或可重构阵列执行的神经网络架构的图。
[0032]图8A是由如图7一样的神经网络架构使用的传感器数据的区块的组织的简化图示。
[0033]图8B是由如图7一样的神经网络架构使用的传感器数据的区块的补片的简化图示。
[0034]图9示出了可配置或可重构阵列(诸如现场可编程门阵列(FPGA))上的如图7一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种系统,所述系统包括:主机处理器;存储器,所述存储器能够由所述主机处理器访问,所述存储器存储:神经网络的拓扑结构,用于配置所述拓扑结构以执行碱基检出操作的多个权重集,所述多个权重集中的权重集在多个训练数据集中的相应训练数据集上进行训练,所述训练数据集对应于所述碱基检出操作的多个测序事件中的相应测序事件,所述测序事件跨越所述碱基检出操作经过一系列感测循环中的感测循环子系列的时间进展和所述碱基检出操作经过生物传感器上的位置的空间进展,和用于所述一系列感测循环中的感测循环的传感器数据;和可配置处理器,所述可配置处理器能够访问所述存储器并且配置有数据流逻辑以:在所述可配置处理器的处理元件上加载所述拓扑结构,至少部分地基于感测循环的受试者子系列和/或所述生物传感器上的受试者位置从所述多个权重集中选择权重集,在所述处理元件上加载用于所述感测循环的受试者子系列和所述生物传感器上的所述受试者位置的受试者传感器数据,以及在所述处理元件上加载所选择的权重集中的权重以用所述权重配置所述拓扑结构,并且使所述神经网络对所述受试者传感器数据应用所选择的权重集中的所述权重以产生碱基检出分类数据。2.根据权利要求1所述的系统,其中所述感测循环子系列包括初始感测循环子系列、中间感测循环子系列和最终感测循环子系列,并且其中所述训练数据集和所述权重集分别对应于所述初始感测循环子系列、所述中间感测循环子系列和所述最终感测循环子系列。3.根据权利要求1或2所述的系统,其中所述生物传感器上的所述位置包括边缘位置和非边缘位置,并且其中所述训练数据集和所述权重集分别对应于所述边缘位置和所述非边缘位置。4.根据权利要求1至3中任一项所述的系统,其中所述生物传感器上的所述位置包括第一象限位置、第二象限位置、第三象限位置和第四象限位置,并且其中所述训练数据集和所述权重集分别对应于所述第一象限位置、所述第二象限位置、所述第三象限位置和所述第四象限位置。5.根据权利要求1至4中任一项所述的系统,其中所述生物传感器被分区为多个区块,并且所述边缘位置、所述非边缘位置、所述第一象限位置、所述第二象限位置、所述第三象限位置和所述第四象限位置中的各个位置包括所述多个区块中对应的一个或多个区块。6.根据权利要求1至5中任一项所述的系统,其中所述测序事件跨越所述碱基检出操作经过碱基检出双端读段的时间进展,并且其中所述训练数据集和所述权重集分别对应于所述双端读段中的读段。7.根据权利要求1至6中任一项所述的系统,其中:所述感测循环子系列包括初始感测循环子系列、中间感测循环子系列和最终感测循环子系列;所述生物传感器上的所述位置包括边缘位置和非边缘位置;并且
所述训练数据集并且因此所述权重集分别对应于(i)所述初始感测循环子系列和所述边缘位置,(ii)所述中间感测循环子系列和所述边缘位置,(iii)所述最终感测循环子系列和所述边缘位置,(iv)所述初始感测循环子系列和所述非边缘位置,(v)所述中间感测循环子系列和所述非边缘位置,以及(vi)所述最终感测循环子系列和所述非边缘位置。8.根据权利要求1至7中任一项所述的系统,其中:所述感测循环子系列包括初始感测循环子系列、中间感测循环子系列和最终感测循环子系列;所述生物传感器上的所述位置包括第一类别的位置和第二类别的位置;并且所述训练数据集并且因此所述权重集分别对应于(i)所述初始感测循环子系列和所述第一类别的位置,(ii)所述中间感测循环子系列和所述第一类别的位置,(iii)所述最终感测循环子系列和所述第一类别的位置,(iv)所述初始感测循环子系列和所述第二类别的非边缘位置,(v)所述中间感测循环子系列和所述第二类别的位置,以及(vi)所述最终感测循环子系列和所述第二类别的位置。9.根据权利要求1至8中任一项所述的系统,其中所述可配置处理器进一步:确定当前测序运行的一个或多个参数;以及进一步基于所述当前测序运行的所确定的所述一个或多个参数从所述多个权重集中选择所述权重集。10.根据权利要求9所述的系统,其中所述当前测序运行的所确定的所述一个或多个参数包括以下中的一者或多者:所述生物传感器中使用的反应组分的特征或与所述传感器数据相关联的定相特征。11.一种系统,所述系统包括:主机处理器;存储器,所述存储器能够由所述主机处理器访问,所述存储器存储:神经网络的拓扑结构,用于配置所述拓扑结构以执行碱基检出操作的第一权重集、第二权重集和第三权重集,所述第一权重集、所述第二权重集和所述第三权重集分别对应于一系列感测循环中的第一感测循环子系列、第二感测循环子系列和第三感测循环子系列,和分别对应于所述第一感测循环子系列、所述第二感测循环子系列和所述第三感测循环子系列的第一传感器数据、第二传感器数据和第三传感器数据;和可配置处理器,所述可配置处理器能够访问所述存储器并且配置有数据流逻辑以:在所述可配置处理器的处理元件上加载所述拓扑结构,在所述处理元件上加载所述第一传感器数据,在所述处理元件上加载所述第一权重集以用所述第一权重集中的权重配置所述拓扑结构,并且使所述神经网络对所述第一传感器数据应用所述第一权重集中的所述权重以产生用于所述第一感测循环子系列中的感测循环的第一碱基检出分类数据,在所述处理元件上加载所述第二传感器数据,在所述处理元件上加载所述第二权重集以用所述第二权重集中的权重配置所述拓扑结构,并且使所述神经网络对所述第二传感器数据应用所述第二权重集中的所述权重以产生用于所述第二感测循环子系列中的感测循环的第二碱基检出分类数据,以及
在所述处理元件上加载所述第三传感器数据,在所述处理元件上加载所述第三权重集以用所述第三权重集中的权重配置所述拓扑结构,并且使所述神经网络对所述第三传感器数据应用所述第三权重集中的所述权重以产生用于所述第三感测循环子系列中的感测循环的第三碱基检出分类数据。12.根据权利要求11所述的系统,其中所述存储器进一步存储:用于配置所述拓扑结构以执行碱基检出操作的第四权重集、第五权重集和后续权重集,所述第四权重集、所述第五权重集和所述后续权重集分别对应于所述一系列感测循环中的第四感测循环子系列、第五感测循环子系列和后续感测循环子系列;和用于所述第四感测循环子系列、所述第五感测循环子系列和所述后续感测循环子系列的第四传感器数据、第五传感器数据和后续传感器数据。13.根据权利要求11或12所述的系统,其中所述可配置处理器配置有数据流逻辑以:在所述处理元件上加载所述第四传感器数据,在所述处理元件上加载所述第四权重集以用所述第四权重集中的权重配置所述拓扑结构,并且使所述神经网络对所述第四传感器数据应用所述第四权重集中的所述权重以产生用于所述第四感测循环子系列中的感测循环的第四碱基检出分类数据;在所述处理元件上加载所述第五传感器数据,在所述处理元件上加载所述第五权重集以用所述第五权重集中的权重配置所述拓扑结构,并且使所述神经网络对所述第五传感器数据应用所述第五权重集中的所述权重以产生用于所述第五感测循环子系列中的感测循环的第五碱基检出分类数据;以及在所述处理元件上加载所述后续传感器数据和所述...

【专利技术属性】
技术研发人员:G
申请(专利权)人:因美纳软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1