基因编辑效率检测方法、装置和电子设备制造方法及图纸

技术编号:37505785 阅读:34 留言:0更新日期:2023-05-07 09:42
本申请涉及一种基因编辑效率检测方法、基因编辑效率检测装置和电子设备。该基因编辑效率检测方法包括:通过基于引物和扩增子的匹配对所述待检测基因编辑数据进行数据拆分;对拆分后的数据进行基于动态最小重叠下限的双端读段合并;对合并后的数据进行重复标记;基于局部比对对重复标记后的数据和未进行双端读段合并的数据进行比对,和对局部对比结果进行全局重比对;基于局部对比结果和全局重比对结果进行编辑事件识别和序列过滤;以及,基于过滤后的合格序列计算基因编辑效率。这样,可以在保持基因编辑效率检测准确性的同时提高基因编辑效率的检测效率。因编辑效率的检测效率。因编辑效率的检测效率。

【技术实现步骤摘要】
基因编辑效率检测方法、装置和电子设备


[0001]本申请涉及基因编辑
,更为具体地说,涉及一种基因编辑效率检测方法、基因编辑效率检测装置和电子设备。

技术介绍

[0002]随着基因编辑技术的广泛使用,尤其是以基因编辑作为技术手段的药物开发方面的研究越来越深入,对于目标位点以及潜在脱靶位点编辑事件的快速准确检测变得越来越重要。基因编辑的具体检测方面主要包括编辑效率、编辑产物形式、脱靶效应、编辑结果一致性等。
[0003]目前,基因编辑效率的检测主要有以下几种方案。
[0004]传统湿实验法可以通过对编辑区域进行一代测序或者其他酶学反应来评估编辑前后编辑位点的变化情况。该方法的缺点是灵敏度低且通量低。
[0005]基于二代测序的方法通过使用高深度二代测序,能够极大地提高检测灵敏度和检测通量,但是同时也存在一系列的问题,如PCR错误,测序错误等。这里,DNA测序指的是对DNA分子的核苷酸排列顺序的测定,也就是测定组成DNA分子的A、T、G、C的排列顺序。并且,二代测序技术是大规模平行测序,核心思想是用成百上千万条短读长的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基因编辑效率检测方法,其特征在于,包括:通过基于引物和扩增子的匹配对所述待检测基因编辑数据进行数据拆分;对拆分后的数据进行基于动态最小重叠下限的双端读段合并;对合并后的数据进行重复标记;基于局部比对对重复标记后的数据和未进行双端读段合并的数据进行比对,和对局部对比结果进行全局重比对;基于局部对比结果和全局重比对结果进行编辑事件识别和序列过滤;以及基于过滤后的合格序列计算基因编辑效率。2.如权利要求1所述的基因编辑效率检测方法,其特征在于,通过基于引物和扩增子的匹配对所述待检测基因编辑数据进行数据拆分包括:以引物为基础构建索引;使用哈希表查询以预定精度匹配基因编辑数据的每条读段与扩增子的参考库;响应于基因编辑数据的预定读段未能以预定精度匹配扩增子的参考库,使用所述预定读段的一部分进行基于所述索引的查询匹配;以及基于匹配结果将所述待检测基因编辑数据拆分为多个第一序列。3.如权利要求2所述的基因编辑效率检测方法,其特征在于,对拆分后的数据进行基于动态最小重叠下限的双端读段合并包括:使用扩增子序列特异性预先估计用于所述双端序列合并的动态最小重叠下限,所述动态最小重叠下限的长度大于所述扩增子序列中的重复部分的长度;以及基于所述动态最小重叠下限对所述多个第一序列进行双端序列合并以获得多个第二序列。4.如权利要求3所述的基因编辑效率检测方法,其特征在于,对合并后的数据进行重复标记包括:使用哈希算法对所述多个第二序列进行重复标记以获得多个第三序列。5.如权利要求4所述的基因编辑效率检测方法,其特征在于,使用哈希算法对所述多个第二序列进行重复标记以获得多个第三序列包括:响应于所述多个第二序列具有包含方向性的序列,将反向互补的序列标记为重复;和/或响应于所述多个第二序列包含单细胞的标记序列,在单细胞层面进行序列的重复标记。6.如权利要求4所述的基因编辑效率检测方法,其特征在于,对局部对比结果进行全局重比对包括:对所述局部对比结果进行基于编辑酶切割位点敏感性的全局重比对以获得多个第四序列。7.如权利要求6所述的基因编辑效率检测方法,其特征在于,基于局部对比结果和全局重比对结果进行编辑事件识别和序列过滤包括以下的至少其中之一:基于每个序列中的碱基匹配数目和匹配部分错误率确定不可靠序列;基于每个序列中的插入和缺失以及...

【专利技术属性】
技术研发人员:张永建伍林军袁鹏飞
申请(专利权)人:博雅缉因北京生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1