【技术实现步骤摘要】
【国外来华专利技术】核苷酸序列变体的频率分布的确定
本公开内容总体涉及分析核苷酸序列样本的领域。更具体地说,涉及在这样一个样本中核苷酸序列变体的频率分布的确定。
技术介绍
在分析核苷酸序列样本(例如脱氧核糖核酸(DNA)或核糖核酸(RNA))样本时,可能期望能够实现对样本中的核苷酸序列变体的频率分布的准确确定。特别地,可能期望能够实现在样本中围绕感兴趣的特定位点的核苷酸序列变体的频率分布的准确确定。本公开内容的其余部分涉及围绕这样一个感兴趣的特定位点(也称为靶位点或靶位)的核苷酸序列变体。本文提及的核苷酸序列可具有任何合适的长度并且可包括一个或多个核苷酸序列实体。例如,核苷酸序列可由一个完整基因组、一个基因组的一个或多个染色体、或者一个或多个染色体的一个或多个部分(例如基因)组成。例如,如果原始核苷酸序列出于某些目的被改变,例如如果特定位点在基因编辑过程中被有意修改(例如与Cre组合相比较),则核苷酸序列样本可包括改变的核苷酸序列的集合。在这样一个例子中,能够准确确定有多少被改变的核苷酸序列经历了哪种改变,可能是令人关注的。准确 ...
【技术保护点】
1.一种用于确定核苷酸序列样本(101、410、500)的多个核苷酸序列变体(501、502、503)的频率分布的方法,/n其中,所述多个核苷酸序列变体包括核苷酸参考序列(501),并且/n其中,与所述核苷酸参考序列不同的每个核苷酸序列变体(502、503),与所述核苷酸参考序列在至少一个中间部分(504、505)上不同,并且与所述核苷酸参考序列在所述核苷酸参考序列的至少两个部分(506)上一致,/n所述方法包括:/n-(110)生成序列参考变体的参考变体列表(430、510),所述参考变体列表(430、510)包括多个核苷酸序列变体的单一核苷酸序列变体(511、512、5 ...
【技术特征摘要】
【国外来华专利技术】20180411 SE 1850405-01.一种用于确定核苷酸序列样本(101、410、500)的多个核苷酸序列变体(501、502、503)的频率分布的方法,
其中,所述多个核苷酸序列变体包括核苷酸参考序列(501),并且
其中,与所述核苷酸参考序列不同的每个核苷酸序列变体(502、503),与所述核苷酸参考序列在至少一个中间部分(504、505)上不同,并且与所述核苷酸参考序列在所述核苷酸参考序列的至少两个部分(506)上一致,
所述方法包括:
-(110)生成序列参考变体的参考变体列表(430、510),所述参考变体列表(430、510)包括多个核苷酸序列变体的单一核苷酸序列变体(511、512、513);
-(120)通过对所述参考变体列表的每个序列参考变体执行多个参考序列读取(432)来生成序列读取数据的参考集(440、520),其中每个参考序列读取具有读取起始位置RSS(521);
-(130、442)对每个RSS和每个序列参考变体的中间部分,基于对应参考序列读取至所述参考变体列表的比对,确定所述中间部分是否能够通过对应参考序列读取来检测;
-(140、414、464)通过对所述核苷酸序列样本的多个核苷酸序列变体片段中的每一个执行一个或多个样本序列读取(464)来生成序列读取数据的样本集(470、630),其中每个样本序列读取对应于一个参考序列读取,并且具有对应的RSS(621、622);
-(150、435)对每个RSS和每个序列参考变体的所述中间部分,基于对应样本序列读取至所述参考变体列表的比对,来确定序列读取数据在所述样本集中的总出现次数(480、640);以及
-(180、497)基于所述总出现次数确定多个核苷酸序列变体的频率分布(499),并对每个RSS确定所述中间部分是否能够被检测。
2.根据权利要求1所述的方法,所述方法还包括定义所述核苷酸参考序列。
3.根据权利要求1-2中任一项所述的方法,其中,所述中间部分是插入、缺失、修改和转位中的一种或多种。
4.根据权利要求1-3中任一项所述的方法,其中,对RSS和序列参考变体的所述中间部分,确定所述中间部分是否能够通过对应参考序列读取检测包括:
通过比对来确定在所述对应参考序列和所述序列参考变体之间的所述RSS的检测相关性值;
当所述检测相关性值高于检测阈值时,确定所述中间部分能够在所述RSS处通过对应参考序列读取来检测;以及
当所述检测相关性值不高于所述检测阈值时,确定所述中间部分在所述RSS处不能通过对应参考序列读取检测。
5.根据权利要求1-4中任一项所述的方法,其中,对RSS和序列参考变体的所述中间部分,确定在所述样本集中的...
【专利技术属性】
技术研发人员:D·尤多维克,J·拉森,
申请(专利权)人:泰格丘公司,
类型:发明
国别省市:瑞典;SE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。