一种STR基因数据分析的方法技术

技术编号:24891404 阅读:49 留言:0更新日期:2020-07-14 18:17
本发明专利技术公开了一种STR基因数据分析的方法,是基于C++语言,对DNA中的短串联重复序列STR基因测序数据进行定位全自动化分析,整体提高数据处理效率,最终得到与特定性状关联的基因区域,并提供丰富的定位结果展示图表。本算法支持多色的荧光通道的分析;支持现在市面上常用的试剂盒;支持常见的测序仪输出的原始数据文件格式;对检验中产生的杂峰进行自动识别去除;对测序过程中产生的峰型错位自动校准。本发明专利技术实现了在法医鉴定检测DNA的工作中,对DNA基因短串联序列STR进行多色荧光色通道的全自动数据分析。打破了DNA测序只能依赖国外软件分析的状况,为我国发展国产测序仪和国产试剂奠定了进程,加快了我国法医鉴定检测DNA领域的国产化的发展进程。

【技术实现步骤摘要】
一种STR基因数据分析的方法
本专利技术涉及STR基因数据
,具体为一种STR基因数据分析的方法。
技术介绍
微卫星DNA中的短串联重复序列简称STR,是一种DNA多态性,广泛存在于人类基因组的23对染色体上,通常由2-6bp的重复单位组成,不同个体(或等位基因)之间的差异一般只表现为重复单位的重复数目差异。STR基因座是一种重要的遗传标记,在多态性程度高的基因座上,其个体识别能力强,并且可以简单地用PCR技术检测出来。STR基因座具有以下特点:STR多态性基因座数量多,片段长度一般小于400bp,易于扩增,适于微量检材的检验;等位基因大小比较接近,较小等位基因优先扩增不明显;不同位点的STR基因座片段长度差异较小,便于复合扩增,提高检测效率。此外,STR基因座分析方法简便,便于实验DNA分型标准化和自动化,便于分型数据的计算机储存、联网检索。目前STR技术已经是法医学中应用范围最广泛,使用频率最高的DNA分型技术。目前对STR短串联重复序列的解析,通常是需要专业分析软件对测序仪生成的原始数据.fsa/.hid文件进行读取解析,从本文档来自技高网...

【技术保护点】
1.一种STR基因数据分析的方法,其特征在于,包括以下步骤:/n步骤1:数据收集,测序仪输出的.fsa,.hid的格式的原始数据文件在指定路径,系统进行实时刷新,查看到指定路径下有新的数据文件,即进行读取;/n步骤2:原始数据解析,通过读取原始数据的头文件数据,根据头文件里所设置各个数据包的类型和描述,确定每个染色通道数据的位移位置与数据长度,使用傅里叶级数公式,按时间方向和频率方向,组成正余弦波峰值图像;/n步骤3:荧光颜色分离-根据使用数据中的内标数据,作为原始图谱的绝对定位位置,以及厂家提供的基因座配置文件作为原始图谱的逻辑位置,按已定内标的逻辑位置,将各荧光通道按不同颜色进行分离;/n...

【技术特征摘要】
1.一种STR基因数据分析的方法,其特征在于,包括以下步骤:
步骤1:数据收集,测序仪输出的.fsa,.hid的格式的原始数据文件在指定路径,系统进行实时刷新,查看到指定路径下有新的数据文件,即进行读取;
步骤2:原始数据解析,通过读取原始数据的头文件数据,根据头文件里所设置各个数据包的类型和描述,确定每个染色通道数据的位移位置与数据长度,使用傅里叶级数公式,按时间方向和频率方向,组成正余弦波峰值图像;
步骤3:荧光颜色分离-根据使用数据中的内标数据,作为原始图谱的绝对定位位置,以及厂家提供的基因座配置文件作为原始图谱的逻辑位置,按已定内标的逻辑位置,将各荧光通道按不同颜色进行分离;
步骤4:峰值计算,根据每个基因座范围与高低峰阈值比率,即杂合子的峰高差值比率,进行正常峰与异常峰的自动判定,判定是以出峰位置是否在基因座范围内或峰高比率超过阈值;<...

【专利技术属性】
技术研发人员:秦叶
申请(专利权)人:北京博安智联科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1