System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 短串联重复的分析方法、装置、设备及存储介质制造方法及图纸_技高网

短串联重复的分析方法、装置、设备及存储介质制造方法及图纸

技术编号:40036764 阅读:7 留言:0更新日期:2024-01-16 19:05
本申请涉及一种短串联重复的分析方法、装置、设备及存储介质。短串联重复的分析方法包括:根据待测样本的外显子组测序数据分析得到的短串联重复区域确定预设相关基因的重复次数数据的置信度并获得第一预设分值;根据短串联重复区域内预设相关基因的重复次数数据确定第二预设分值;根据短串联重复区域中两条等位基因的覆盖程度获得第三预设分值;根据待测样本的转录组测序数据分析得到的预设相关基因中与预设疾病相关的富集程度确定第四预设分值;根据第一预设分值、第二预设分值、第三预设分值和第四预设分值,确定短串联重复的类型。本申请实施例具有准确度高的优点。

【技术实现步骤摘要】

本申请涉及基因测序,特别是涉及一种短串联重复的分析方法、装置、设备及存储介质


技术介绍

1、短串联重复(short tandem repeat,简称str)是长度为1-6bp不等的核酸序列模块重复串联在一起的序列结构。由于其核心单位重复数目在个体间呈高度异质性且数量丰富,从而构成了str基因座的遗传多态性。目前str常被应用于遗传制图、司法学鉴定、亲属关系分析、疾病基因定位及物种多态性等领域研究中。除此之外str重复扩增还与严重的神经疾病或神经肌肉疾病如亨廷顿舞蹈症、各种共济失调、肌萎缩性侧索硬化症、额颞叶痴呆和脆x综合症等有关。同时str的重复次数与疾病严重程度、发病年龄及临床症状密切相关,故str重复次数的准确检测可为疾病的诊断和管理提供重要依据。

2、但是,由于测序技术不同、测序偏好等因素,使得不同str分析预测结果存在偏差和不稳定性。


技术实现思路

1、有鉴于此,本申请实施例为解决
技术介绍
中存在的至少一个问题而提供一种短串联重复的分析方法、装置、设备及计算机可读存储介质。

2、第一方面,本申请实施例提供一种短串联重复的分析方法,包括:

3、根据待测样本的外显子组测序数据分析得到的所述待测样本的短串联重复区域,确定所述短串联重复区域内预设相关基因的重复次数数据的置信度并获得与所述置信度对应的第一预设分值;

4、根据所述短串联重复区域内预设相关基因的重复次数数据,确定所述预设相关基因中与预设疾病相关的异常扩增次数范围并获得与所述异常扩增次数范围对应的第二预设分值;

5、根据所述短串联重复区域中两条等位基因的覆盖程度,获得与所述覆盖程度对应的第三预设分值;

6、根据所述待测样本的转录组测序数据分析得到的所述预设相关基因中与预设疾病相关的富集程度,确定与所述富集程度对应的第四预设分值;

7、根据所述第一预设分值、所述第二预设分值、所述第三预设分值和所述第四预设分值,确定所述短串联重复的类型;所述类型包括多态性短串联重复、致病性短串联重复和待定性短串联重复。

8、结合第一方面,在一可选实施方式中,所述第一预设分值包括第一一号分值或第一二号分值;

9、所述根据待测样本的外显子组测序数据分析得到的所述待测样本的短串联重复区域,确定所述短串联重复区域内预设相关基因的重复次数数据的置信度并获得与所述置信度对应的第一预设分值,包括:

10、根据待测样本的外显子组测序数据分析得到的所述待测样本的短串联重复区域,确定所述短串联重复区域内的脱氧核糖核酸片段数量是否满足数量预设条件;所述数量预设条件根据预设脱氧核糖核酸片段数量确定;

11、若满足数量预设条件,确定所述短串联重复区域内预设相关基因的重复次数数据的置信度为高置信度并获得与所述高置信度对应的第一一号分值;

12、若不满足数量预设条件,确定所述短串联重复区域内预设相关基因的重复次数数据的置信度为低置信度并获得与所述低置信度对应的第一二号分值。

13、结合第一方面,在一可选实施方式中,所述第二预设分值包括第二一号分值、第二二号分值或第二三号分值;

14、所述根据所述短串联重复区域内预设相关基因的重复次数数据,确定所述预设相关基因中与预设疾病相关的异常扩增次数范围并获得与所述异常扩增次数范围对应的第二预设分值,包括:

15、根据所述短串联重复区域内预设相关基因的重复次数数据,确定所述预设相关基因中与预设疾病相关的异常扩增次数的最大值是否小于或等于正常扩增次数参考最大值;

16、若小于或等于正常扩增次数参考最大值,获得与所述最大值对应的第二一号分值;

17、若大于正常扩增次数参考最大值,确定所述最大值是否大于或等于异常扩增次数参考最小值;

18、若大于或等于异常扩增次数参考最小值,获得与所述最大值对应的第二二号分值;

19、若小于异常扩增次数参考最小值,获得与所述最大值对应的第二三号分值。

20、结合第一方面,在一可选实施方式中,所述第三预设分值包括第三一号分值或第三二号分值;

21、所述根据所述短串联重复区域中两条等位基因的覆盖程度,获得与所述覆盖程度对应的第三预设分值,包括:

22、若所述短串联重复区域中两条等位基因的覆盖程度满足第一类情况,获得与所述覆盖程度对应的第三一号分值;

23、若所述短串联重复区域中两条等位基因的覆盖程度满足第二类情况,获得与所述覆盖程度对应的第三二号分值;

24、其中,所述第一类情况和所述第二类情况的区分根据所述短串联重复发生在单个外显子区或多个外显子区的连续覆盖数确定。

25、结合第一方面,在一可选实施方式中,所述第四预设分值包括第四一号分值或第四二号分值;

26、所述根据所述待测样本的转录组测序数据分析得到的所述预设相关基因中与预设疾病相关的富集程度,确定与所述富集程度对应的第四预设分值,包括:

27、根据所述待测样本的转录组测序数据分析得到的所述预设相关基因中与预设疾病相关的富集程度的平均值,确定所述平均值与富集参考值的差值的绝对值是否大于或等于预设阈值;

28、若大于或等于预设阈值,获得与所述平均值对应的第四一号分值;

29、若小于预设阈值,获得与所述平均值对应的第四二号分值。

30、结合第一方面,在一可选实施方式中,所述根据所述第一预设分值、所述第二预设分值、所述第三预设分值和所述第四预设分值,确定所述短串联重复的类型,包括:

31、根据所述第一预设分值、所述第二预设分值、所述第三预设分值和所述第四预设分值之和确定的总分值和所述短串联重复区域内预设相关基因的重复次数数据,确定所述短串联重复的类型。

32、结合第一方面,在一可选实施方式中,所述根据所述第一预设分值、所述第二预设分值、所述第三预设分值和所述第四预设分值之和确定的总分值和所述短串联重复区域内预设相关基因的重复次数数据,确定所述短串联重复的类型,包括:

33、若与预设疾病相关的异常扩增次数的最大值小于正常扩增次数参考最大值,且所述总分值大于第一分值阈值,确定所述短串联重复为待定性短串联重复;

34、若与预设疾病相关的异常扩增次数的最大值小于正常扩增次数参考最大值,且所述总分值小于或等于第一分值阈值,确定所述短串联重复为多态性短串联重复;

35、若与预设疾病相关的异常扩增次数的最大值大于或等于正常扩增次数参考最大值且小于或等于异常扩增次数参考最小值,且所述总分值大于第一分值阈值,确定所述短串联重复为待定性短串联重复;

36、若与预设疾病相关的异常扩增次数的最大值大于或等于正常扩增次数参考最大值且小于或等于异常扩增次数参考最小值,且所述总分值小于或等于第一分值阈值,确定所述短串联重复为多态性短串联重复;

37、若与预设疾病相关的异常扩增次数的本文档来自技高网...

【技术保护点】

1.一种短串联重复的分析方法,其特征在于,包括:

2.根据权利要求1所述的短串联重复的分析方法,其特征在于,所述第一预设分值包括第一一号分值或第一二号分值;

3.根据权利要求2所述的短串联重复的分析方法,其特征在于,所述第二预设分值包括第二一号分值、第二二号分值或第二三号分值;

4.根据权利要求3所述的短串联重复的分析方法,其特征在于,所述第三预设分值包括第三一号分值或第三二号分值;

5.根据权利要求4所述的短串联重复的分析方法,其特征在于,所述第四预设分值包括第四一号分值或第四二号分值;

6.根据权利要求5所述的短串联重复的分析方法,其特征在于,所述根据所述第一预设分值、所述第二预设分值、所述第三预设分值和所述第四预设分值,确定所述短串联重复的类型,包括:

7.根据权利要求6所述的短串联重复的分析方法,其特征在于,所述根据所述第一预设分值、所述第二预设分值、所述第三预设分值和所述第四预设分值之和确定的总分值和所述短串联重复区域内预设相关基因的重复次数数据,确定所述短串联重复的类型,包括:

8.一种短串联重复的分析装置,其特征在于,包括:

9.一种短串联重复的分析设备,其特征在于,包括处理器和存储器,所述存储器上存储有计算机可执行指令,所述计算机可执行指令被所述处理器运行时执行如权利要求1-7任一项所述的短串联重复的分析方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可执行指令,所述计算机可执行指令被处理器运行时执行如权利要求1-7任一项所述的短串联重复的分析方法。

...

【技术特征摘要】

1.一种短串联重复的分析方法,其特征在于,包括:

2.根据权利要求1所述的短串联重复的分析方法,其特征在于,所述第一预设分值包括第一一号分值或第一二号分值;

3.根据权利要求2所述的短串联重复的分析方法,其特征在于,所述第二预设分值包括第二一号分值、第二二号分值或第二三号分值;

4.根据权利要求3所述的短串联重复的分析方法,其特征在于,所述第三预设分值包括第三一号分值或第三二号分值;

5.根据权利要求4所述的短串联重复的分析方法,其特征在于,所述第四预设分值包括第四一号分值或第四二号分值;

6.根据权利要求5所述的短串联重复的分析方法,其特征在于,所述根据所述第一预设分值、所述第二预设分值、所述第三预设分值和所述第四预设分值,确定所述短串联重复的类...

【专利技术属性】
技术研发人员:张立陆敏佳胡腾贾佳杨志芳彭嵋
申请(专利权)人:上海福君基因生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1