基于人工智能的碱基检出制造技术

技术编号:27890768 阅读:21 留言:0更新日期:2021-03-31 02:14
所公开的技术通过神经网络处理输入数据并产生该输入数据的另选表示。该输入数据包括用于测序运行的一个或多个测序循环中的每个测序循环的针对每个循环的图像数据。针对每个循环的图像数据描绘了在相应的测序循环处捕获的一个或多个分析物及其周围背景的强度发射。所公开的技术通过输出层处理该另选表示,并且在这些测序循环中的一个或多个测序循环处基于该输出对这些分析物中的一个或多个分析物进行碱基检出。

【技术实现步骤摘要】
【国外来华专利技术】基于人工智能的碱基检出优先权申请本专利申请要求以下专利申请的优先权或权益:2019年3月21日提交的名称为“TrainingDataGenerationforArtificialIntelligence-BasedSequencing”的美国临时专利申请第62/821,602号(代理人案卷号ILLM1008-1/IP-1693-PRV);2019年3月21日提交的名称为“ArtificialIntelligence-BasedGenerationofSequencingMetadata”的美国临时专利申请第62/821,618号(代理人案卷号ILLM1008-3/IP-1741-PRV);2019年3月21日提交的名称为“ArtificialIntelligence-BasedBaseCalling”的美国临时专利申请第62/821,681号(代理人案卷号ILLM1008-4/IP-1744-PRV);2019年3月21日提交的名称为“ArtificialIntelligence-BasedQualityScoring”的美国临时专利申请第62/821,724号(代理人案卷号ILLM1008-7/IP-1747-PRV);2019年3月21日提交的名称为“ArtificialIntelligence-BasedSequencing”的美国临时专利申请第62/821,766号(代理人案卷号ILLM1008-9/IP-1752-PRV);2019年6月14日提交的名称为“TrainingDataGenerationforArtificialIntelligence-BasedSequencing”的荷兰专利申请第2023310号(代理人案卷号ILLM1008-11/IP-1693-NL);2019年6月14日提交的名称为“ArtificialIntelligence-BasedGenerationofSequencingMetadata”的荷兰专利申请第2023311号(代理人案卷号ILLM1008-12/IP-1741-NL);2019年6月14日提交的名称为“ArtificialIntelligence-BasedBaseCalling”的荷兰专利申请第2023312号(代理人案卷号ILLM1008-13/IP-1744-NL);2019年6月14日提交的名称为“ArtificialIntelligence-BasedQualityScoring”的荷兰专利申请第2023314号(代理人案卷号ILLM1008-14/IP-1747-NL);并且2019年6月14日提交的名称为“ArtificialIntelligence-BasedSequencing”的荷兰专利申请第2023316号(代理人案卷号ILLM1008-15/IP-1752-NL)。2020年3月20日提交的名称为“TrainingDataGenerationforArtificialIntelligence-BasedSequencing”的美国非临时专利申请第16/825,987号(代理人案卷号ILLM1008-16/IP-1693-US);2020年3月20日提交的名称为“TrainingDataGenerationforArtificialIntelligence-BasedSequencing”的美国非临时专利申请第16/825,991号(代理人案卷号ILLM1008-17/IP-1741-US);2020年3月20日提交的名称为“ArtificialIntelligence-BasedBaseCalling”的美国非临时专利申请第16/826,126号(代理人案卷号ILLM1008-18/IP-1744-US);2020年3月20日提交的名称为“ArtificialIntelligence-BasedQualityScoring”的美国非临时专利申请第16/826,134号(代理人案卷号ILLM1008-19/IP-1747-US);2020年3月21日提交的名称为“ArtificialIntelligence-BasedSequencing”的美国非临时专利申请第16/826,168号(代理人案卷号ILLM1008-20/IP-1752-PRV);同时提交的名称为“TrainingDataGenerationforArtificialIntelligence-BasedSequencing”的PCT专利申请No.PCT________(代理人案卷号ILLM1008-21/IP-1693-PCT),该专利申请随后公开为PCT公布No.WO____________;同时提交的名称为“ArtificialIntelligence-BasedGenerationofSequencingMetadata”的PCT专利申请No.PCT________(代理人案卷号ILLM1008-22/IP-1741-PCT),该专利申请随后公开为PCT公布No.WO____________;同时提交的名称为“ArtificialIntelligence-BasedQualityScoring”的PCT专利申请No.PCT________(代理人案卷号ILLM1008-24/IP-1747-PCT),该专利申请随后公开为PCT公布No.WO____________;以及同时提交的名称为“ArtificialIntelligence-BasedSequencing”的PCT专利申请No.PCT________(代理人案卷号ILLM1008-25/IP-1752-PCT),该专利申请随后公开为PCT公布No.WO____________;据此将这些优先权申请以引用方式并入,即如同在本文完整示出一样,以用于所有目的。文献并入以下文献以引用方式并入,即如同在本文完整示出一样,以用于所有目的:2019年5月16日提交的名称为“SystemsandDevicesforCharacterizationandPerformanceAnalysisofPixel-BasedSequencing”的美国临时专利申请第62/849,091号(代理人案卷号ILLM1011-1/IP-1750-PRV);2019年5月16日提交的名称为“BaseCallingUsingConvolutions”的美国临时专利申请第62/849,132号(代理人案卷号ILLM1011-2/IP-1750-PR2);2019年5月16日提交的名称为“BaseCallingUsingCompactConvolutions”的美国临时专利申请第62/849,133号(代理人案卷号ILLM1011-3/IP-1750-PR3);2020年2月20日提交的名称为“ArtificialIntelligence-BasedBaseCallingofIndexSequence本文档来自技高网...

【技术保护点】
1.一种对簇进行碱基检出的计算机实现的方法,所述方法包括:/n通过神经网络处理输入数据并产生所述输入数据的另选表示,其中所述输入数据包括:/n(i)测序运行的一个或多个测序循环中的每个测序循环的针对每个循环的数据,所述针对每个循环的数据包括像素,所述像素描绘指示在所述测序循环中的相应测序循环处的所述一个或多个簇的强度发射,和/n(ii)补充距离信息,所述补充距离信息识别所述针对每个循环的数据的所述像素之间的距离;/n其中,在所述神经网络对所述针对每个循环的数据的所述像素的处理期间,所述补充距离信息随所述针对每个循环的数据一起提供并向所述神经网络传达所述针对每个循环的数据的所述像素中的哪些像素包含所述簇的中心并且所述针对每个循环的数据的所述像素中的哪些像素远离所述簇的所述中心;/n通过输出层处理所述另选表示并产生输出;以及/n基于所述输出,在所述测序循环中的一个或多个测序循环处对所述簇中的一个或多个簇进行碱基检出。/n

【技术特征摘要】
【国外来华专利技术】20190614 NL 2023310;20190614 NL 2023311;20190614 N1.一种对簇进行碱基检出的计算机实现的方法,所述方法包括:
通过神经网络处理输入数据并产生所述输入数据的另选表示,其中所述输入数据包括:
(i)测序运行的一个或多个测序循环中的每个测序循环的针对每个循环的数据,所述针对每个循环的数据包括像素,所述像素描绘指示在所述测序循环中的相应测序循环处的所述一个或多个簇的强度发射,和
(ii)补充距离信息,所述补充距离信息识别所述针对每个循环的数据的所述像素之间的距离;
其中,在所述神经网络对所述针对每个循环的数据的所述像素的处理期间,所述补充距离信息随所述针对每个循环的数据一起提供并向所述神经网络传达所述针对每个循环的数据的所述像素中的哪些像素包含所述簇的中心并且所述针对每个循环的数据的所述像素中的哪些像素远离所述簇的所述中心;
通过输出层处理所述另选表示并产生输出;以及
基于所述输出,在所述测序循环中的一个或多个测序循环处对所述簇中的一个或多个簇进行碱基检出。


2.根据权利要求1所述的计算机实现的方法,其中所述针对每个循环的数据指示所述测序循环中的所述相应测序循环处的周围背景。


3.根据权利要求1至2中任一项所述的计算机实现的方法,其中所述补充距离信息提高所述碱基检出的准确度。


4.根据权利要求3所述的计算机实现的方法,其中所述神经网络使用所述补充距离信息,通过关注中心簇像素、它们的相邻像素以及从它们导出的另选表示而不是周边簇像素、背景像素以及从它们导出的另选表示,来将测序信号分配给其适当源簇。


5.根据权利要求1所述的计算机实现的方法,所述方法还包括随所述针对每个循环的数据一起提供补充缩放信息,所述补充缩放信息将缩放值分配给所述针对每个循环的数据的所述像素。


6.根据权利要求1所述的计算机实现的方法,其中所述针对每个循环的数据指示在所述相应测序循环处检测到的电压变化。


7.根据权利要求1所述的计算机实现的方法,其中所述针对每个循环的数据指示在所述相应测序循环处测量的电流信号。


8.一种对在包括多个测序循环的测序运行期间合成的簇进行碱基检出的神经网络实现的方法,所述方法包括:
通过卷积神经网络卷积输入数据以生成所述输入数据的卷积表示,
其中所述输入数据包括从在所述测序运行的当前测序循环处生成的当前图像集中的每个当前图像集中的一个或多个图像、在所述测序运行的在所述当前测序循环之前的一个或多个测序循环处分别生成的一个或多个先前图像集中的每个先前图像集中的一个或多个图像、以及在所述测序运行的在所述当前测序循环之后的一个或多个测序循环处分别生成的一个或多个后续图像集中的每个后续图像集中的一个或多个图像提取的图像补片,
其中所述图像补片中的每个图像补片描绘了被碱基检出的目标簇的强度发射,并且
其中所述输入数据还包括指示所述图像补片的像素距所述图像补片的中心像素的相应距离的距离信息;
通过输出层处理所述卷积表示以产生输出;以及
基于所述输出,在所述当前测序循环处对所述目标簇进行碱基检出。


9.根据权利要求8所述的神经网络实现的方法,所述方法还包括:
向所述卷积神经网络提供表示相应簇的图像区域的中心的位置坐标作为输入,
其中向所述卷积神经网络的第一层提供所述输入,
其中向所述卷积神经网络的一个或多个中间层提供所述输入,并且
其中向所述卷积神经网络的最终层提供所述输入。


10.根据权利要求8至9中任一项所述的神经网络实现的方法,所述方法还包括:
向所述卷积神经网络提供强度缩放通道作为输入,所述强度缩放通道具有对应于所述图像补片的像素的缩放值,并且
其中所述缩放值基于所述图像补片的中心像素的平均强度,每个图像补片包含特定的目标簇。


11.根据权利要求8至10中任一项所述的神经网络实现的方法,其中所述强度缩放通道逐像素地包括用于所述图像补片的所有所述像素的相同缩放值。


12.根据权利要求8所述的神经网络实现的方法,其中每个图像补片还包括像素距离数据,所述像素距离数据指示相应像素与所述多个簇中的最近簇之间的距离,所...

【专利技术属性】
技术研发人员:K·贾加纳坦J·R·高贝尔A·起亚
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1