【技术实现步骤摘要】
本申请涉及数据处理,更具体的说是涉及一种用于碱基识别的质量参数确定方法及装置。
技术介绍
1、在基因测序结果文件中会存在多种数据,其中,至少包括两个重要数据:碱基识别(basecall)结果数据和质量分数数据。质量分数通常以q值表示,q值存在的意义在于给每一个被识别或输出的碱基进行评分,从而确定该碱基的可信度。可见质量分数q值的应用准确性会影响最终的碱基识别结果。
技术实现思路
1、有鉴于此,本申请提供如下技术方案:
2、一种用于碱基识别的质量参数确定方法,包括:
3、获得碱基识别模型针对待识别核酸样本的识别结果数据,所述识别结果数据包括针对所述待识别核酸样本当前碱基延伸反应的碱基概率分布;
4、基于所述碱基概率分布,计算得到第一参数;
5、基于预设q0值,对所述第一参数进行过滤处理,得到目标质量参数,其中,q0=-10×log10e,e为碱基识别错误率。
6、可选地,所述基于所述碱基概率分布,计算得到第一参数,包括:
【技术保护点】
1.一种用于碱基识别的质量参数确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述碱基概率分布,计算得到第一参数,包括:
3.根据权利要求1-2任一项所述的方法,其特征在于,还包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设Q0值,对所述第一参数进行过滤处理,得到目标质量参数,包括:
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:
7.根据权利要求1-6任一项所述的方
...【技术特征摘要】
1.一种用于碱基识别的质量参数确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述碱基概率分布,计算得到第一参数,包括:
3.根据权利要求1-2任一项所述的方法,其特征在于,还包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设q0值,对所述第一参数进行过滤处理,得到目标质量参数,包括:
5.根据权利要求1-4任一项所述的方法,其...
【专利技术属性】
技术研发人员:刘雨润,陈巍月,
申请(专利权)人:深圳市真迈生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。