【技术实现步骤摘要】
【国外来华专利技术】用于在参考基因组中定位样本读段的设备和方法
[0001]相关申请的交叉引用
[0002]本申请涉及2020年3月17日提交的并且名称为“REFERENCE
‑
GUIDED GENOME SEQUENCING”的共同未决的美国申请16/821,849(代理人案卷号WDA
‑
4724
‑
US),其全部内容据此以引用方式并入。本申请还涉及2020年3月18日提交的并且名称为“REFERENCE
‑
GUIDED GENOME SEQUENCING”的共同未决的美国申请16/822,010(代理人案卷号WDA
‑
4725
‑
US),其全部内容据此以引用方式并入。
技术介绍
[0003]目前的DNA(脱氧核糖核酸)样本处理的局限性导致样本读段或样本基因组的部分在样本基因组中具有通常未知的位置。对于在将样本读段彼此比较以在样本基因组内定位样本读段时不使用参考基因组的从头测序,通常将样本读段作为单个大组分析,这需要大量的存储器资源和高计算成本来将大组中的样本读段彼此比较以确定样本读段在样本基因组内的位置。此类从头测序的常规方法相对于基因组测序需要处理的大量数据是不可扩展的。更详细地,常规的从头测序方法通常将一大组样本读段存储在共享存储器诸如昂贵的2TB DRAM中。由于可通过独立的高带宽信道连接到共享DRAM的计算核的数量是有限的(例如,至多24个核),所以这种布置限制了可用于从头测序的独立计算线程的数量(例如,至多128个计算线程)。 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种设备,所述设备包括:多个单元组,其中每个单元组被配置为:存储代表来自参考基因组的参考碱基的参考序列,所述参考序列对应于相应单元组中的单元的顺序;以及存储代表来自样本读段的样本碱基的当前子串序列,所述当前子串序列对应于所述相应单元组中的所述单元的所述顺序;其中所述多个单元组中的每个单元组被进一步配置为存储相同的当前子串序列和代表所述参考基因组的一部分的参考序列,所述参考基因组的所述部分与由存储在一个或多个其他单元组中的一个或多个其他参考序列所代表的所述参考基因组的至少一个其他部分部分地重叠;和电路,所述电路被配置为识别所述多个单元组中的其中所存储的参考序列与存储在所述单元组中的所述当前子串序列相匹配的单元组。2.根据权利要求1所述的设备,其中所述电路和每个单元组中的至少一者被进一步配置为执行一个或多个逻辑运算以确定所存储的参考序列是否与存储在所述单元组中的所述当前子串序列相匹配。3.根据权利要求1所述的设备,其中所述多个单元组的每个单元被进一步配置为:执行至少一个XNOR运算,以将来自所述当前子串序列的样本碱基的存储在所述单元中的第一值与来自存储在所述相应单元组中的所述参考序列的参考碱基的存储在所述单元中的第二值进行比较;以及将所述至少一个XNOR运算的比较值输出到所述电路,所述比较值指示所述单元的所述样本碱基是否与所述单元的所述参考碱基相匹配。4.根据权利要求3所述的设备,其中所述电路被进一步配置为通过对从相应单元组的所述单元输出的所述比较值执行AND运算来识别其中所存储的参考序列与存储在所述单元组中的所述当前子串序列相匹配的单元组。5.根据权利要求1所述的设备,其中所述多个单元组的每个单元被进一步配置为:计算存储在所述单元中代表所述样本碱基和所述参考碱基的值的乘积;以及将所述乘积输出到所述电路;并且其中所述电路被进一步配置为至少部分地基于由所述单元输出的所述乘积来识别其中所存储的参考序列与存储在所述单元组中的所述当前子串序列相匹配的单元组。6.根据权利要求5所述的设备,其中所述电路被进一步配置为,对于所述多个单元组中的每个单元组:对由所述单元组中的所述单元输出的乘积求和;将所述和与所述单元组中的单元数量的预定倍数进行比较;以及响应于所述和等于所述单元组中的所述单元数量的所述预定倍数,将所述单元组识别为其中所存储的参考序列与存储在所述单元组中的所述当前子串序列相匹配。7.根据权利要求1所述的设备,其中所述多个单元组中的每个单元组由预定数量的单元组成,所述预定数量的单元在17至25个单元的范围内。8.根据权利要求1所述的设备,其中所述多个单元的每个单元组被进一步配置为:用代表来自所述样本读段的样本碱基的后续子串序列重写所述当前子串序列,以将所
述后续子串序列存储在所述单元组中;以及保留存储在所述单元组中的相应参考序列;并且其中所述电路被进一步配置为识别所述多个单元组中的其中存储在所述单元组中的所保留的参考序列与存储在所述单元组中的所述后续子串序列相匹配的单元组。9.根据权利要求1所述的设备,其中所述电路被进一步配置为基于以下步骤的迭代来确定所述样本读段在所述参考基因组内的概率性位置:将所述样本读段的不同子串序列存储在所述多个单元组中;以及识别所述多个单元组中的其中所存储的参考序列与存储在所述单元组中的所述子串序列相匹配的单元组。10.根据权利要求1所述的设备,其中所述设备包括现场可编程门阵列(FPGA)和专用集成电路(ASIC)中的至少一者。11.根据权利要求1所述的设备,其中所述多个单元组中的所述单元包括寄存器、锁存器和触发器中的至少一者。12.一种相对于参考基因组来定位样本读段的方法,所述方法包括:在多个单元组中存储代表来自所述参考基因组的参考碱基的参考序列,所述参考序列对应于所述多个单元组中的相应单元组中的单元的顺序,其中所述多个单元组中的每个单元组存储代表所述参考基因组的一部分的参考序列,所述参考基因组的所述部分与由存储在一个或多个其他单元组中的一个或多个其他参考序列所代表的所述参考基因组的至少一个其他部分部分地重叠;在所述多个单元组中的每个单元组中存储样本碱基的当前子串序列,所述当前子串序列对应于所述多个单元组中的所述相应单元组中的单元的所述顺序;以及识别所述多个单元组中的其中所存储的参考序列与存储在所述单元组中的所述当...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。