基于人工智能的测序制造技术

技术编号:28148632 阅读:12 留言:0更新日期:2021-04-21 19:37
所公开的技术通过第一神经网络处理第一输入并产生第一输出。该第一输入包括来源于由测序系统在测序运行中捕获的分析物及其周围背景的图像的第一图像数据。所公开的技术通过后处理器处理该第一输出并产生关于该分析物及其周围背景的元数据。所公开的技术通过第二神经网络处理第二输入并产生第二输出。该第二输入包括通过基于该元数据修改第二图像数据而导出的第三图像数据。该第二图像数据来源于该分析物及其周围背景的该图像。该第二输出识别在该测序运行的一个或多个测序循环处对该分析物中的一个或多个分析物的碱基检出。分析物中的一个或多个分析物的碱基检出。分析物中的一个或多个分析物的碱基检出。

【技术实现步骤摘要】
【国外来华专利技术】Scoring”的美国非临时专利申请第16/826,134号(代理人案卷号ILLM1008

19/IP

1747

US);
[0017]2020年3月21日提交的名称为“Artificial Intelligence

Based Sequencing”的美国非临时专利申请第16/826,168号(代理人案卷号ILLM1008

20/IP

1752

PRV);
[0018]同时提交的名称为“Training Data Generation for Artificial Intelligence

Based Sequencing”的PCT专利申请No.PCT________(代理人案卷号ILLM 1008

21/IP

1693

PCT),该专利申请随后公开为PCT公布No.WO____________;
[0019]同时提交的名称为“Artificial Intelligence

Based Generation of Sequencing Metadata”的PCT专利申请No.PCT________(代理人案卷号ILLM 1008

22/IP

1741

PCT),该专利申请随后公开为PCT公布No.WO____________;
[0020]同时提交的名称为“Artificial Intelligence

Based Base Calling”的PCT专利申请No.PCT________(代理人案卷号ILLM 1008

23/IP

1744

PCT),该专利申请随后公开为PCT公布No.WO____________;以及
[0021]同时提交的名称为“Artificial Intelligence

Based Quality Scoring”的PCT专利申请No.PCT________(代理人案卷号ILLM 1008

24/IP

1747

PCT),该专利申请随后公开为PCT公布No.WO____________。
[0022]据此将这些优先权申请以引用方式并入,即如同在本文完整示出一样,以用于所有目的。
[0023]文献并入
[0024]以下文献以引用方式并入,即如同在本文完整示出一样,以用于所有目的:
[0025]2019年5月16日提交的名称为“Systems and Devices for Characterization and Performance Analysis of Pixel

Based Sequencing”的美国临时专利申请第62/849,091号(代理人案卷号ILLM 1011

1/IP

1750

PRV);
[0026]2019年5月16日提交的名称为“Base Calling Using Convolutions”的美国临时专利申请第62/849,132号(代理人案卷号ILLM 1011

2/IP

1750

PR2);
[0027]2019年5月16日提交的名称为“Base Calling Using Compact Convolutions”的美国临时专利申请第62/849,133号(代理人案卷号ILLM1011

3/IP

1750

PR3);
[0028]2020年2月20日提交的名称为“Artificial Intelligence

Based Base Calling of Index Sequences”的美国临时专利申请第62/979,384号(代理人案卷号ILLM 1015

1/IP

1857

PRV);
[0029]2020年2月20日提交的名称为“Artificial Intelligence

Based Many

To

Many Base Calling”的美国临时专利申请第62/979,414号(代理人案卷号ILLM 1016

1/IP

1858

PRV);
[0030]2020年2月20日提交的名称为“Knowledge Distillation

Based Compression of Artificial Intelligence

Based Base Caller”的美国临时专利申请第62/979,385号(代理人案卷号ILLM 1017

1/IP

1859

PRV);
[0031]2020年2月20日提交的名称为“Multi

Cycle Cluster Based Real Time Analysis System”的美国临时专利申请第62/979,412号(代理人案卷号ILLM 1020

1/IP

1866

PRV);
[0032]2020年2月20日提交的名称为“Data Compression for Artificial Intelligence

Based Base Calling”的美国临时专利申请第62/979,411号(代理人案卷号ILLM 1029

1/IP

1964

PRV);
[0033]2020年2月20日提交的名称为“Squeezing Layer for Artificial Intelligence

Based Base Calling”的美国临时专利申请第62/979,399号(代理人案卷号ILLM 1030

1/IP

1982

PRV);
[0034]Liu P、Hemani A、Paul K、Weis C、Jung M、Wehn N,“3D

Stacked Many

Core Architecture for Biological Sequence Analysis Problems”,Int J Parallel Prog,20本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种端对端测序的计算机实现的方法,所述端对端测序包括将基于神经网络的模板生成与基于神经网络的碱基检出集成,所述方法包括:访问包含处于一定光学像素分辨率的像素的第一图像数据和第二图像数据,其中所述第一图像数据包括由测序系统针对测序运行的测序循环中的初始测序循环捕获的簇及其周围背景的图像,并且其中所述第二图像数据包括由所述测序系统针对所述测序运行的所述初始测序循环和附加测序循环捕获的所述簇及其周围背景的图像;通过基于神经网络的模板生成器处理所述第一图像数据,并且产生识别簇元数据的簇映射,其中所述簇元数据基于簇中心、簇形状、簇尺寸、簇背景和/或簇边界识别所述簇的空间分布信息,并且其中所述基于神经网络的模板生成器基于将所述簇的所述图像映射到所述簇元数据的任务来训练;以上采样的子像素分辨率对模板图像中的所述簇的所述空间分布信息进行编码,其中所述模板图像的子像素和所述簇的所述图像的所述像素表示相同的成像区域;基于所述模板图像修改所述第二图像数据的所述像素的强度值,并且产生具有强度分布的所述第二图像数据的强度修改版本,所述强度分布考虑了所述簇的所述空间分布信息;以及通过基于神经网络的碱基检出器处理所述第二图像数据的所述强度修改版本,并且在所述测序运行的一个或多个测序循环处产生对所述簇中的一个或多个簇的碱基检出,其中所述基于神经网络的碱基检出器基于将所述簇的所述图像映射到所述碱基检出的任务来训练。2.根据权利要求1所述的计算机实现的方法,还包括:代替修改所述第二图像数据的所述像素的所述强度值,用所述模板图像补充所述第二图像数据;以及通过所述基于神经网络的碱基检出器处理补充有所述模板图像的所述第二图像数据,并且在所述测序运行的一个或多个测序循环处产生对所述簇中的一个或多个簇的碱基检出。3.根据权利要求1所述的计算机实现的方法,其中所述模板图像中的每个子像素被识别为背景子像素、簇中心子像素或簇内部子像素。4.根据权利要求1至3中任一项所述的计算机实现的方法,其中修改所述第二图像数据的所述像素的强度值包括:基于所述模板图像中与所述第二图像数据的所述图像中的像素对应的多少个子像素包含所述簇中的一个或多个簇的部分,计算所述第二图像数据中的一个或多个像素的面积加权因子;以及基于所述面积加权因子修改所述像素的强度。5.根据权利要求1至4中任一项所述的计算机实现的方法,其中修改所述第二图像数据的所述像素的强度值包括:将簇及其周围背景的所述图像上采样达到所述上采样的子像素分辨率,以产生上采样
的图像,以及将背景强度分配给所述上采样的图像中与所述模板图像中的背景子像素对应的那些子像素,以及将簇强度分配给所述上采样的图像中与所述模板图像中的簇中心子像素和簇内部子像素对应的那些子像素。6.根据权利要求5所述的计算机实现的方法,其中所述背景强度具有零值。7.根据权利要求1至6中任一项所述的计算机实现的方法,其中通过内插处于所述光学像素分辨率的所述像素的强度来确定所述簇强度。8.根据权利要求1至7中任一项所述的计算机实现的方法,其中修改所述第二图像数据的所述像素的强度值包括:将簇及其周围背景的所述图像上采样达到所述上采样的子像素分辨率,以产生上采样的图像,以及将所述光学像素域中的像素的整个强度分布在所述上采样的图像中的所述像素的仅那些与所述模板图像中的所述簇中心子像素和所述簇内部子像素对应的组成子像素中。9.一种计算机实现的方法,所述方法包括:使用第一神经网络来确定关于簇的模板图像,其中所述模板图像识别选自以下的所述属性中的至少一个属性:所述簇的空间分布、簇形状、所述簇的中心和簇边界;以及使用第二神经网络基于所述模板图像对所述簇进行碱基检出。10.根据权利要求10所述的计算机实现的方法,其中所述模板图像包括经修改的强度值,以识别选自以下的所述属性中的至少一个属性:所述簇的空间分布、簇形状、所述簇的中心和簇边界;以及通过所述第二神经网络处理所述经修改的强度值,以对所述簇进行碱基检出。11.根据权利要求9或10所述的计算机实现的方法,其中所述模板图像包括模板图像。12.根据权利要求11所述的计算机实现的方法,还包括:评估上采样的子像素域中针对至少一个特定簇的所述模板图像,以识别包含所述至少一个特定簇的部分的像素以及也包含所述至少一个特定簇的部分的与所述像素相邻的像素;基于所识别的像素中的每个像素中的多少个子像素包含所述至少一个特定簇的部分来计算每个像素的面积加权因子;以及基于相应像素的所述面积加权因子修改所识别的像素和所述相邻像素的像素强度值以用于处理。13.根据权利要求12所述的计算机实现的方法,其中评估所述模板图像还包括:通过所述第一神经网络处理在多个测序循环中的一个或多个初始测序循环处分别生成的一个或多个初始图像集,以产生所述模板图像,从而以所述上采样的子像素分辨率识别所述簇的所述中心、形状和边界;其中每个图像集包括一个或多个图像,所述图像中的每个图像描绘了在一个或多个成像通道中的相应成像通道中以所述光学像素分辨率捕获的所述簇及其周围背景的强度发射。14.根据权利要求12或13所述的计算机实现的方法,其中评估所述模板图像还包括:评估所述至少一个特定簇的所述簇形状和簇边界,以识别包含所述至少一个特定簇的部分的至少一个像素以及也包含所述至少一个特定簇的部分的与所述像素相邻的像素;并且其中所述方法还包括
将所述面积加权因子存储在所述模板图像中;以及用具有经修改的像素强度值的像素生成所述图像中的每个图像的经修改版本;通过所述第二神经网络处理所述图像的经修改版本,以生成所述经修改版本的另选表示;...

【专利技术属性】
技术研发人员:A
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1