利用深度学习的碱基编辑基因剪刀的效率和结果预测系统和方法技术方案

技术编号:39294872 阅读:10 留言:0更新日期:2023-11-07 11:02
本发明专利技术涉及利用深度学习的碱基编辑基因剪刀的效率和结果预测系统等,根据所述系统,可以选择用于高效碱基编辑的碱基编辑剪刀和单向导核糖核酸(single

【技术实现步骤摘要】
利用深度学习的碱基编辑基因剪刀的效率和结果预测系统和方法
[0001]相关申请的交叉引用
[0002]本申请要求于2022年04月29日提交的韩国专利申请No.10

2022

00053742的优先权和权益,其通过引用合并于此用于所有目的,如同在此完全阐述一样。


[0003]本专利技术涉及一种利用深度学习的碱基编辑基因剪刀的效率和结果预测系统等。

技术介绍

[0004]碱基编辑(base editing)允许将一个碱基对转换为另一个碱基对,而不需要供体脱氧核糖核酸(donor DNA)或产生双链截断体。碱基编辑基因剪刀(base editor)由碱基编辑蛋白(base editor protein)和单向导核糖核酸(single

guide RNA:sgRNA)构成,在此,碱基编辑蛋白基本上是Cas9切口酶和诸如胞苷或腺苷脱氨酶(cytidine or adenosine deaminases)的碱基改变酶的融合体。胞嘧啶碱基编辑基因剪刀(cytosine base editors:CBEs)可以将C
·
G转换为T
·
A,腺嘌呤碱基编辑基因剪刀(adenine base editors:ABEs)可以将A
·
T转换为G
·
C。在CBE的情况下,经常添加尿嘧啶糖基化酶抑制剂(uracil glycosylase inhibitor:UGI)以提高碱基编辑效率和纯度。除了这两个主要的碱基编辑基因剪刀,对于将C
·
G转换为G
·
C的碱基编辑基因剪刀(CGBEs),通过去除UGI和/或添加尿嘧啶DNA N

糖基化酶(uracil DNA N

glycosylase:UNG),CBE诱导的碱基编辑基因剪刀可以将C
·
G转换为G
·
C。为了改善此类碱基编辑的效率和准确度,开发了诸如YE1

BE4max、SsAPOBEC3B、ABE8e(V106W)、ABE8.17

m+V106W、CGBE1、miniCGBE1和APOBEC

nCas9

Ung5的具有改善的碱基转换区域(即具有或不具有UGI或UNG等的辅助因子的脱氨酶)的碱基编辑基因剪刀,但没有对其变体进行广泛比较,因此对于选择使用包括哪种碱基转换区域的碱基编辑基因剪刀仍然很困难。
[0005]碱基编辑中的另一变数为Cas9切口酶,其通过包括位于距离目标核苷酸约15
±
2个核苷酸的位置的前间隔序列邻近基序(protospacer

adjacent motif:PAM)来识别相应目标序列。例如,SpCas9的标准PAM序列是NGG,其通常在所需位置不可用,因此无法进行通过最少的旁观者编辑(bystander editing)组成的有效碱基编辑。另外,该PAM要求条件将Cas9限制应用在其他类型的基因组编辑(例如,平铺筛选(tiling screening)、特定目标删除和高效同源性诱导改变)和碱基编辑中。为了克服这些限制,已经开发了具有几种PAM兼容的Cas9变体,例如,作为识别PAM而不是NGG的初期Cas9版本,包括xCas9和SpCas9

NG、以及VQR、VRER、VRQR和QQR1变体,其后,更多的变体被报道,例如SpCas9

NRRH、SpCas9

NRTH、SpCas9

NRCH、SpG、SpRY和Sc++20。然而,由于这些变体也没有被广泛比较,尤其是对于碱基编辑,仍然很难选择将哪种Cas9使用在给定的目标序列。
[0006]因此,本专利技术的专利技术人将具有多个碱基转换区域的7个碱基编辑基因剪刀变体(YE1

BE4max、SsAPOBEC3B、ABE8e(V106W)、ABE8.17

m+V106W、CGBE1、miniCGBE1和APOBEC

nCas9

Ung)(图1A)、具有彼此不同或修改的PAM兼容性的10个Cas9变体(VRQR变体、xCas9、SpCas9

NG、SpCas9

NRRH、SpCas9

NRTH、SpCas9

NRCH、SpG、SpRY和Sc++)(图1B)、以及具有彼此不同或修改的PAM兼容性且包括Cas9切口酶区域的10个碱基编辑基因剪刀变体(SpCas9

YE1

BE4max、SpCas9

NRCH

YE1

BE4max、

YE1

BE4max、SpCas9

NRCH

SsAPOBEC3B、SpCas9

ABE8e(V106W)、SpRY

ABE8e(V106W)、SpCas9

NRCH

ABE8.17

m+V106W、SpRY

ABE8.17

m+V106W、SpCas9

miniCGBE1和SpCas9

NRCH

APOBEC

nCas9

Ung)(图1C)在数百或数千个目标序列中进行广泛比较。结果,开发了深Cas9变体(DeepCas9variant),其为基于有关所得Cas9和碱基编辑基因剪刀变体活性的大规模数据集预测9个Cas9变体的效率的基于深度学习的计算模型,并开发了预测63个碱基编辑基因剪刀的效率和编辑结果频率的深BE(DeepBE),其通过组合这9个Cas9变体和7种脱氨基结构域而生成的。

技术实现思路

[0007]一方面提供一种利用深度学习的碱基编辑基因剪刀的效率和结果预测系统。
[0008]另一方面提供一种利用深度学习的碱基编辑基因剪刀的效率和结果预测方法。
[0009]另一方面提供一种计算机可读记录介质,其上记录有用于由计算机执行利用深度学习的碱基编辑基因剪刀的效率和结果预测方法的程序。
[0010]一方面提供一种利用深度学习的碱基编辑基因剪刀的效率和结果预测系统。
[0011]具体地,一方面提供一种利用深度学习的碱基编辑基因剪刀的效率和结果预测系统,其包括:目标序列输入单元,其接收碱基编辑基因剪刀的目标序列数据;以及结果预测单元,其将由所述目标序列输入单元接收的目标序列数据分别应用于碱基编辑效率和结果比率的预测模型来获得碱基编辑效率和结果比率的输出值,并将所述碱基编辑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用深度学习的碱基编辑基因剪刀的效率和结果预测系统,包括:目标序列输入单元,其接收碱基编辑基因剪刀的目标序列数据;以及结果预测单元,其将由所述目标序列输入单元接收的目标序列数据分别应用于碱基编辑效率和结果比率的预测模型来获得碱基编辑效率和结果比率的输出值,并将所述碱基编辑效率和结果比率的输出值相乘来生成碱基编辑预测分数。2.根据权利要求1所述的利用深度学习的碱基编辑基因剪刀的效率和结果预测系统,其中,所述碱基编辑效率的预测模型是通过以下步骤来生成的:通过信息输入单元接收碱基编辑基因剪刀的碱基转换活性数据的步骤;以及对由所述信息输入单元接收的数据执行基于卷积神经网络的深度学习来生成碱基编辑效率的预测模型的步骤。3.根据权利要求2所述的利用深度学习的碱基编辑基因剪刀的效率和结果预测系统,其中,所述执行基于卷积神经网络的深度学习来生成碱基编辑效率的预测模型的步骤还包括连接CRISPR相关蛋白9(Cas9)活性数据的步骤。4.根据权利要求3所述的利用深度学习的碱基编辑基因剪刀的效率和结果预测系统,其中,所述Cas9活性数据通过执行包括以下步骤的方法而获得的:将Cas9引入包括寡核苷酸的细胞文库中的步骤,所述寡核苷酸包括编码单向导核糖核酸(sgRNA)的核苷酸序列和所述sgRNA靶向的目标核苷酸序列;利用从引入了所述Cas9的细胞文库中获得的脱氧核糖核酸(DNA)执行深度测序的步骤;以及从所述深度测序获得的数据分析Cas9的效率的步骤。5.根据权利要求4所述的利用深度学习的碱基编辑基因剪刀的效率和结果预测系统,其中,所述分析Cas9的效率的步骤通过执行基于卷积神经网络的深度学习来从特定目标序列中Cas9插入缺失频率的相关关系预测Cas9的活性。6.根据权利要求1所述的利用深度学习的碱基编辑基因剪刀的效率和结果预测系统,其中,所述碱基编辑结果比率的预测模型是通过以下步骤来生成的:通过信息输入单元接收碱基编辑基因剪刀的碱基编辑结果数据的步骤;以...

【专利技术属性】
技术研发人员:金炯凡金那惠
申请(专利权)人:延世大学校产学协力团
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1