用于评估微卫星不稳定性状态的方法和系统技术方案

技术编号:28491942 阅读:23 留言:0更新日期:2021-05-19 22:16
用于评估微卫星不稳定性(MSI)的方法分析对应于MSI的多个标记区域的核酸序列读段。标记区域可以包含长均聚物和/或短串联重复序列(STR)。对于靶均聚物,基于序列读段中的均聚物区域的流空间信号测量结果而计算均聚物信号值直方图。基于均聚物信号值直方图的特征为对应于靶均聚物的每一标记区域确定每标记的得分。对于靶STR,方法包含计算对应于靶STR的标记区域的序列读段的重复长度直方图。基于重复长度直方图的特征计算每STR标记的得分。可以组合多个每标记得分以形成样品的总MSI得分。组合多个每标记得分以形成样品的总MSI得分。组合多个每标记得分以形成样品的总MSI得分。

【技术实现步骤摘要】
【国外来华专利技术】用于评估微卫星不稳定性状态的方法和系统
[0001]交叉申请
[0002]本申请要求2019年6月7日提交的美国临时申请第62/858,387、2018年12月27日提交的美国临时申请第62/785,596号以及2018年10月12日提交的美国临时申请第62/745,161号在35U.S.C.
§
119(e)下的权益。前述申请的全部内容以引用的方式并入本文中。
[0003]序列表
[0004]本申请在此以引用的方式并入有与此同时提交的电子序列表材料。电子序列表中的材料以于2019年10月2日创建的标题为LT01423_ST25的文本(.txt)文件(其文件大小是755字节)形式提交且以全文引用的方式并入本文中。


[0005]本申请大体上涉及用于检测微卫星不稳定性(MSI)的方法、系统、计算机可读介质、组成物和套组,且更具体地说,涉及用于基于或使用核酸测序数据和下一代测序技术检测MSI的方法、系统、计算机可读介质、组成物和套组,以及结合用于检测一个或多个感兴趣的MSI事件的引物的或系统。

技术实现思路

[0006]整个基因组中微卫星位置处的与癌症相关联的不稳定性已展示为预测对免疫疗法治疗的反应。在DNA错配修复(MMR)系统未能恰当工作时,可能会导致微卫星不稳定性高(MSI

H)状态,并且所述微卫星不稳定性高状态与整个基因组中的短DNA序列重复序列(微卫星位置)的超变异性相关联。在1997年,NCI建议利用一组五个MSI标记来检测结肠直肠癌(CRC)。传统方法使用毛细电泳法(CE)并且利用肿瘤/正常组织对之间的标记概况的差异来确定所述肿瘤的MSI状态。
[0007]最近,对开发具有更多标记的MSI检测更敏感的解决方案的需求不断增长。下一代测序(NGS)提供了一种能够处理多个样品和大量标记的自然解决方案。MSI标记可以是超长均聚物、二核苷酸(di

nuc)和三核苷酸(tri

nuc)短串联重复序列(STR)。由于存在包含影子带等各种不同的伪影,因此这些类型的基元不容易准确扩增或准确测序。
[0008]需要新的和改进的方法、系统、计算机可读介质、组成物和套组以更好且更准确地检测MSI,包含更好且更准确检测基因组区域以进行MSI状态评估。需要基于不同类型的MSI标记(例如长均聚物和STR)准确地评估MSI状态。需要使用仅肿瘤样品来确定MSI状态。
[0009]根据示例性实施例,提供一种用于检测样品中的微卫星不稳定性(MSI)的方法,其包含:(1)接收对应于MSI的多个标记区域的多个核酸序列读段,其中序列读段中的每一个包含左侧翼序列、右侧翼序列和位于左侧翼序列的最右侧碱基和右侧翼序列的最左侧碱基之间的碱基的重复区域,其中重复区域包含对应于多个标记区域的特定标记区域的重复碱基序列的多个重复;(2)对于序列读段中的每一个,将左侧翼序列的至少一部分与参考左侧翼比对,其中参考左侧翼与对应于特定标记区域的参考核酸序列的参考重复区域接壤;(3)对于对应于序列读段中的靶均聚物的重复区域,基于靶均聚物的流空间信号测量结果而计
算均聚物信号值直方图,其中标记区域的至少一部分对应于靶均聚物;(4)基于对应于靶均聚物的每一标记区域的均聚物信号值直方图的特征而确定每标记的得分以产生多个得分;以及(5)组合多个得分以形成样品的总MSI得分。
[0010]根据示例性实施例,提供包括机器可读指令的计算机可读介质,所述机器可读指令在被加载到机器可读存储器中且由处理器执行时被配置成使得系统执行检测样品中的微卫星不稳定性(MSI)的方法,所述方法包含:(1)接收对应于MSI的多个标记区域的多个核酸序列读段,其中序列读段中的每一个包含左侧翼序列、右侧翼序列和位于左侧翼序列的最右侧碱基和右侧翼序列的最左侧碱基之间的碱基的重复区域,其中重复区域包含对应于多个标记区域的特定标记区域的重复碱基序列的多个重复;(2)对于序列读段中的每一个,将左侧翼序列的至少一部分与参考左侧翼比对,其中参考左侧翼与对应于特定标记区域的参考核酸序列的参考重复区域接壤;(3)对于对应于靶均聚物的重复区域,基于靶均聚物的流空间信号测量结果而计算均聚物信号值直方图,其中标记区域的至少一部分对应于靶均聚物;(4)基于对应于靶均聚物的每一标记区域的均聚物信号值直方图的特征而确定每标记的得分以产生多个得分;以及(5)组合多个得分以形成样品的总MSI得分。
[0011]根据示例性实施例,提供一种用于检测微卫星不稳定性(MSI)的系统,其包含:机器可读存储器以及处理器,所述处理器被配置成执行机器可读指令,所述指令在由处理器执行时使得系统执行用于检测样品中的MSI的方法,方法包含:1)接收对应于MSI的多个标记区域的多个核酸序列读段,其中序列读段中的每一个包含左侧翼序列、右侧翼序列和位于左侧翼序列的最右侧碱基和右侧翼序列的最左侧碱基之间的碱基的重复区域,其中重复区域包含对应于多个标记区域的特定标记区域的重复碱基序列的多个重复;(2)对于序列读段中的每一个,将左侧翼序列的至少一部分与参考左侧翼比对,其中参考左侧翼与对应于特定标记区域的参考核酸序列的参考重复区域接壤;(3)对于对应于序列读段中的靶均聚物的重复区域,基于靶均聚物的流空间信号测量结果而计算均聚物信号值直方图,其中标记区域的至少一部分对应于靶均聚物;(4)基于对应于靶均聚物的每一标记区域的均聚物信号值直方图的特征而确定每标记的得分以产生多个得分;以及(5)组合多个得分以形成样品的总MSI得分。
附图说明
[0012]本专利技术的新颖特征在所附权利要求书中具体阐述。将参考阐述说明性实施例和附图的以下详细描述来获得对实施例的特征和优点的更佳理解,在所述附图中:
[0013]图1说明具有MSI标记区域和侧翼区域的核酸序列的实例。图1公开SEQ ID NO:1和SEQ ID NO:2。
[0014]图2说明具有STR区域的序列读段的实例。
[0015]图3是根据示例性实施例的确定MSI得分的方法的框图。
[0016]图4展示分别为MSI

H和MSI

L的两个均聚物序列读段的叠加流空间信号测量结果的实例。
[0017]图5A

5D展示肿瘤和正常样品的HP信号值的直方图的实例。
[0018]图6A和6B展示肿瘤和正常样品的HP信号值的直方图的实例。
[0019]图7是S形函数的实例的曲线图。
[0020]图8A

8D展示MSI

H和匹配的正常样品的重复长度的直方图的实例。
[0021]图9给出具有已知MSI状态的六个样品中的若干标记物的每标记得分和总MSI得分的结果的示例性表格。
[0022]图10给出使用毛细电泳法(CE)测试MSI状态的结果的示例性表格。
[0023]图11给出使用通过本文中所描述的NGS方法确定的总MSI得分来测试MSI状态本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于检测样品中的微卫星不稳定性(MSI)的方法,其包括:接收对应于MSI的多个标记区域的多个核酸序列读段,其中所述序列读段中的每一个包含左侧翼序列、右侧翼序列和位于所述左侧翼序列的最右侧碱基和所述右侧翼序列的最左侧碱基之间的碱基的重复区域,其中所述重复区域包含对应于所述多个标记区域的特定标记区域的重复碱基序列的多个重复;对于所述序列读段中的每一个,将所述左侧翼序列的至少一部分与参考左侧翼比对,其中所述参考左侧翼与对应于所述特定标记区域的参考核酸序列的参考重复区域接壤;对于对应于所述序列读段中的靶均聚物的重复区域,基于所述靶均聚物的流空间信号测量结果而计算均聚物信号值直方图,其中所述标记区域的至少一部分对应于靶均聚物;基于对应于所述靶均聚物的每一标记区域的所述均聚物信号值直方图的特征而确定每标记的得分以产生多个得分;以及组合所述多个得分以形成所述样品的总MSI得分。2.根据权利要求1所述的方法,其中所述标记区域的第二部分对应于靶短串联重复序列(STR)的标记区域,所述方法进一步包括计算对应于所述靶STR的所述标记区域的序列读段的重复长度直方图。3.根据权利要求2所述的方法,其进一步包括基于所述重复长度直方图的特征而确定每STR标记的得分以产生第二多个得分。4.根据权利要求2所述的方法,其中所述确定每STR标记的得分进一步包括计算所述重复长度直方图中的第二高数目的序列读段与第一高数目的序列读段的比率。5.根据权利要求4所述的方法,其进一步包括将S形函数应用于所述比率。6.根据权利要求3所述的方法,其中组合所述多个得分的步骤进一步包括将所述第二多个得分与所述多个得分组合以形成所述总MSI得分。7.根据权利要求1所述的方法,其中组合所述多个得分的步骤进一步包括基于满足最小覆盖准则的标记的数目而将所述总MSI得分归一化。8.根据权利要求1所述的方法,其中所述总MSI得分是使用仅肿瘤分析获得的。9.根据权利要求1所述的方法,其中所述总MSI得分是使用肿瘤

正常分析获得的。10.根据权利要求1所述的方法,其中计算均聚物信号值直方图的步骤进一步包括计算M个流空间信号测量结果的总和,所述M个流空间信号测量结果对应于具有与所述靶均聚物相同的核苷酸类型的流序列的M个核苷酸流,以形成所述序列读段的所述均聚物信号值。11.根据权利要求1所述的方法,其中所述序列读段包含正向方向上的序列读段和反向方向上的序列读段,其中计算均聚物信号值直方图的步骤进一步包括计算所述正向方向上的序列读段的均聚物信号值的第一直方图和所述反向方向上的序列读段的均聚物信号值的第二直方图。12.根据权利要求1所述的方法,其中所述特征是基于所述均聚物信号值的均值和标准差。13.根据权利要求1所述的方法,其中确定每标记的得分的步骤进一步包括将S形函数应用于所述特征中的每一个。14.根据权利要求1所述的方法,其中确定每标记的得分的步骤进一步包括...

【专利技术属性】
技术研发人员:S
申请(专利权)人:生命科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1