当前位置: 首页 > 专利查询>之江实验室专利>正文

基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法和装置制造方法及图纸

技术编号:38017724 阅读:7 留言:0更新日期:2023-06-30 10:44
本发明专利技术公开了一种基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法和装置,采用荧光检测方式检测每个样本中sgRNA作用于目标DNA序列的荧光值,进而得到活性真值,将该活性真值作为训练的监督标签以及性能验证的验证标签,然后利用样本基于深度学习构建的活性检测模型进行训练和预测性能验证,以提升活性检测模型的预测准确性,最后利用验证通过的活性检测模型进行sgRNA活性值的高通量预测,并依据预测结果筛选高性能的sgRNA,该高性能的sgRNA可指导cas12a检测试剂的快速开发制备。sgRNA可指导cas12a检测试剂的快速开发制备。sgRNA可指导cas12a检测试剂的快速开发制备。

【技术实现步骤摘要】
基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法和装置


[0001]本专利技术属于基因检测
,具体涉及一种基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法和装置。

技术介绍

[0002]CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)是原核生物基因组内的一段重复序列,是生命进化历史上,细菌和病毒进行斗争产生的免疫武器,简单说就是病毒能把自己的基因整合到细菌,利用细菌的细胞工具为自己的基因复制服务,细菌为了将病毒的外来入侵基因清除,进化出CRISPR

Cas9系统,利用这个系统,细菌可以不动声色地把病毒基因从自己的基因组上切除,这是细菌特有的免疫系统,是古菌和细菌抵抗病毒等外源遗传物质入侵的一种获得性免疫系统。
[0003]sgRNA引导的CRISPR

Cas系统被广泛用于哺乳动物细胞的基因编辑,在遗传病的基因治疗中展现出巨大的应用潜力。作为基因治疗工具,特异性是一个非常关键的指标。如果一个CRISPR

Cas系统特异性不高,就会发生脱靶。
[0004]高通量筛选(High throughput screening,HTS)技术是指以分子水平和细胞水平的实验方法为基础,以微板形式作为实验工具载体,以自动化操作系统执行试验过程,以灵敏快速的检测仪器采集实验结果数据,以计算机分析处理实验数据,在同一时间检测数以千万的样品,并以得到的相应数据库支持运转的技术体系,它具有微量、快速、灵敏和准确等特点。简言之就是可以通过一次实验获得大量的信息,并从中找到有价值的信息。
[0005]随着人工智能(Artificial Intelligence,AI)技术快速发展,通过AI进行CRISPR检测RNA高通量筛选成为该领域的重要趋势。在过去的几年中,已经开发了几种CRISPR检测sgRNA的评分算法和计算机sgRNA设计网络工具。以促进CRISPR gRNA的设计和实验,该技术具有巨大优势。
[0006]但现有AI模型仍存在机制不明确、数据不平衡、数据异质性、缺乏泛化能力、训练数据集不足、效率低等缺陷,在不久的将来,预计将不断生成高效、特异性、全面、一致、基于测序的数据集。因此,需要不断借助AI以进一步提高准确性并设计具有高靶向活性和低(无)脱靶效应的sgRNA。

技术实现思路

[0007]鉴于上述,本专利技术的目的是提供一种基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法和装置,通过深度学习实现对sgRNA的准确高速筛选。
[0008]为实现上述专利技术目的,实施例提供的一种基于深度学习的cas12a检测试剂的sgRNA的筛选方法,包括以下步骤:
[0009]获取关于cas12a/Cas13的样本数据,每个样本包括sgRNA、目标DNA序列,采用荧光检测方式测量样本中的sgRNA作用于目标DNA序列的荧光值,并将荧光值转化为活性真值,
将样本数据分为训练样本数据和测试样本数据;
[0010]构建基于深度学习的活性检测模型,利用训练样本数据和对应的活性真值对活性检测模型进行监督学习,以优化模型参数,同时利用活性检测模型计算测试样本数据的活性预测值,并基于活性预测值和测试样本的活性真值之间的相关性验证活性检测模型的预测性能;
[0011]将待筛选的sgRNA集合中每个sgRNA和目标DNA序列作为数据对输入至经过验证的活性检测模型,经过计算得到每个sgRNA作用于目标DNA序列的活性预测值;
[0012]根据活性预测值对sgRNA候选集合中sgRNA进行高通量筛选。
[0013]在一个实施方式中,样本数据包括阳性样本和阴性样本,其中,阳性样本中sgRNA对目标DNA序列的反应活性高,即具有高活性真值,阴性样本中sgRNA对目标DNA序列的反应活性低,即具有低活性真值。
[0014]在一个实施方式中,所述将荧光值转化为活性真值,包括:
[0015]活性真值=log(荧光值/阴性标定)
[0016]其中,阴性标定为[M

3σ,M+3σ],其中,M为所有阴性样本测试荧光值的平均值,σ为样本数据的标准差。根据三西格玛准则,通常在平均值正负三倍标准差范围内的数据置信度更高。
[0017]在一个实施方式中,所述活性检测模型包括多个卷积块、展平层、密集层,其中,卷积块包括卷积层、池化层以及批处理层。
[0018]在一个实施方式中,在验证活性检测模型的预测性能时采用的相关性包括斯皮尔曼相关性,其中,斯皮尔曼相关系数大于第一阈值,则认为活性检测模型的预测性能满足要求。
[0019]在一个实施方式中,在验证活性检测模型的预测性能时采用的相关性包括皮尔森相关性,其中,皮尔森相关系数大于第二阈值,则认为活性检测模型的预测性能满足要求。
[0020]在一个实施方式中,在验证活性检测模型的预测性能时采用的相关性包括P值,其中,P值大于第三阈值,则认为活性检测模型的预测性能满足要求。
[0021]在一个实施方式中,所述高通量筛选方法还包括:采用NDCG分数对活性检测模型对测试样本数据的活性预测值的排序情况进行评价,依据NDCG分数对活性检测模型的预测性能进行验证,当NDCG分数大于第四阈值时,则认为活性检测模型的预测性能满足要求。
[0022]为了实现上述专利技术目的,实施例还提供了一种基于深度学习的cas12a检测试剂的sgRNA的高通量筛选装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机处理器执行所述计算机程序时实现上述高通量筛选方法。
[0023]为实现上述专利技术目的,实施例还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理执行时实现上述高通量筛选方法。
[0024]与现有技术相比,本专利技术具有的有益效果至少包括:
[0025]采用荧光检测方式检测每个样本中sgRNA作用于目标DNA序列的荧光值,进而得到活性真值,将该活性真值作为训练的监督标签以及性能验证的验证标签,然后利用样本基于深度学习构建的活性检测模型进行训练和预测性能验证,以提升活性检测模型的预测准确性,最后利用验证通过的活性检测模型进行sgRNA活性值的高通量预测,并依据预测结果
筛选高性能的sgRNA,该高性能的sgRNA可指导cas12a检测试剂的快速开发制备。
附图说明
[0026]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
[0027]图1是实施例提供的sgRNA的高通量筛选方法的流程图;
[0028]图2是实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法,其特征在于,包括以下步骤:获取关于cas12a/Cas13的样本数据,每个样本包括sgRNA、目标DNA序列,采用荧光检测方式测量样本中的sgRNA作用于目标DNA序列的荧光值,并将荧光值转化为活性真值,将样本数据分为训练样本数据和测试样本数据;构建基于深度学习的活性检测模型,利用训练样本数据和对应的活性真值对活性检测模型进行监督学习,以优化模型参数,同时利用活性检测模型计算测试样本数据的活性预测值,并基于活性预测值和测试样本的活性真值之间的相关性验证活性检测模型的预测性能;将待筛选的sgRNA集合中每个sgRNA和目标DNA序列作为数据对输入至经过验证的活性检测模型,经过计算得到每个sgRNA作用于目标DNA序列的活性预测值;根据活性预测值对sgRNA候选集合中的sgRNA进行高通量筛选。2.根据权利要求1所述的基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法,其特征在于,样本数据包括阳性样本和阴性样本,其中,阳性样本中sgRNA对目标DNA序列的反应活性高,即具有高活性真值,阴性样本中sgRNA对目标DNA序列的反应活性低,即具有低活性真值。3.根据权利要求1所述的基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法,其特征在于,所述将荧光值转化为活性真值,包括:活性真值=log(荧光值/阴性标定)其中,阴性标定为[M

3σ,M+3σ],其中,M为所有阴性样本测试荧光值的平均值,σ为样本数据的标准差。4.根据权利要求1所述的基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法,其特征在于,所述活性检测模型包括多个卷积块、展平层、密集层...

【专利技术属性】
技术研发人员:郭玲尹航黄柏成王鑫杰
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1