靶点选择方法及装置、计算机设备制造方法及图纸

技术编号:37708798 阅读:10 留言:0更新日期:2023-06-01 23:59
本公开提供了一种靶点选择方法及装置、计算机设备。方法包括:获取mRNA靶点序列和NGS数据;基于所述mRNA靶点序列生成n1

【技术实现步骤摘要】
靶点选择方法及装置、计算机设备


[0001]本公开涉及生物
,特别涉及一种靶点选择方法及装置、计算机设备。

技术介绍

[0002]基于核糖核酸(Ribonucleic Acid,RNA)的疗法,需要确定药物RNA分子和靶向RNA小分子。各种形式的RNA可用于选择性地作用于常规小分子或蛋白质无法靶向的蛋白质、转录物和基因。靶向RNA的疗法有小干扰RNA(siRNA)和反义寡核苷酸(Antisense Oligonucleotide,ASO),虽然这两类药物特异性较高,但在屈指可数的靶器官范围外,仍有着不小的递送难题。
[0003]因此,选择RNA靶点成为当下RNA疗法的一个难题。相关技术中,通常采用生物实验的方法确定RNA序列上的各个位点能否作为靶点。但是,这种通过实验的方法耗时较长,并且成本高昂。

技术实现思路

[0004]本公开实施例提供了一种靶点选择方法及装置、计算机设备,能够通过计算机对RNA数据处理的方法确定靶点,减少耗时和成本。所述技术方案如下:
[0005]本公开至少一实施例提供了一种靶点选择方法,所述方法包括:
[0006]获取信使核糖核酸mRNA靶点序列和新一代测序NGS数据,所述mRNA靶点序列的长度为N,所述NGS数据为1
×
N的序列矩阵,所述序列矩阵的每个元素对应mRNA靶点序列的一个位点,所述序列矩阵的每个元素表示对应的位点在NGS实验中被N
20
片段杂合的次数;
[0007]基于所述mRNA靶点序列生成n1
×
N的序列特征矩阵,所述序列特征矩阵的每一列元素对应mRNA靶点序列的一个位点,所述序列特征矩阵的每一列元素表示对应的位点的n1个特征;
[0008]将所述序列矩阵和所述序列特征矩阵进行矩阵叠加,得到(n1+1)
×
N的一级结构矩阵;
[0009]将所述一级结构矩阵降维处理成1
×
N的矩阵,并对所述1
×
N的矩阵进行对角化,得到N
×
N的二级结构矩阵,所述二级结构矩阵的每个元素表示对应二级结构的打开概率;
[0010]基于最优路径搜索算法从所述二级结构矩阵中选取一个或多个最优路径,并基于所述最优路径确定所有候选靶标序列。
[0011]可选地,所述特征包括如下至少一项:
[0012]回文结构、序列多态性、重复序列、翻译区起始点、编码区。
[0013]可选地,所述将所述一级结构矩阵降维处理成1
×
N的矩阵,并对所述1
×
N的矩阵进行对角化,得到N
×
N的二级结构矩阵,包括:
[0014]将所述一级结构矩阵的每一列元素相加,得到所述1
×
N的矩阵;
[0015]按照公式Pij=Pi
×
Pj的方式计算所述二级结构矩阵中的各个元素,将计算结果填入所述二级结构矩阵中;其中,Pij为所述二级结构矩阵中的第i行第j个元素,Pi为所述1
×
N的矩阵中的第i个元素,Pj为所述1
×
N的矩阵中的第j个元素,所述i、j均为[1,N]中的正整数。
[0016]可选地,所述基于最优路径搜索算法从所述二级结构矩阵中选取一个或多个最优路径,并基于所述最优路径确定所有候选靶标序列,包括:
[0017]基于n2个选择条件,得到n2个N
×
N的选择条件矩阵,所述选择条件矩阵的每个元素表示对应二级结构在对应条件下的分值,N、n1、n2均为正整数;
[0018]将所述n2个N
×
N的选择条件矩阵降维处理成N
×
N的矩阵,并与所述N
×
N的二级结构矩阵相加,得到N
×
N的路径打分矩阵;
[0019]基于最优路径搜索算法从所述路径打分矩阵中选取一个或多个最优路径,并基于所述最优路径确定所有候选靶标序列。
[0020]可选地,所述选择条件包括如下至少一项:
[0021]熔解温度、结合能、化学合成难度。
[0022]可选地,在对所述一级结构矩阵进行降维处理之前,所述方法还包括:
[0023]对所述一级结构矩阵中的各个元素进行归一化,以使每个元素处于[0,1]的范围内。
[0024]本公开至少一实施例提供了一种靶点选择装置,所述装置包括:
[0025]获取模块,用于获取信使核糖核酸mRNA靶点序列和新一代测序NGS数据,所述mRNA靶点序列的长度为N,所述NGS数据为1
×
N的序列矩阵,所述序列矩阵的每个元素对应mRNA靶点序列的一个位点,所述序列矩阵的每个元素表示对应的位点在NGS实验中被N
20
片段杂合的次数;
[0026]生成模块,用于基于所述mRNA靶点序列生成n1
×
N的序列特征矩阵,所述序列特征矩阵的每一列元素对应mRNA靶点序列的一个位点,所述序列特征矩阵的每一列元素表示对应的位点的n1个特征;
[0027]一级结构矩阵模块,用于将所述序列矩阵和所述序列特征矩阵进行矩阵叠加,得到(n1+1)
×
N的一级结构矩阵;
[0028]二级结构矩阵模块,用于将所述一级结构矩阵降维处理成1
×
N的矩阵,并对所述1
×
N的矩阵进行对角化,得到N
×
N的二级结构矩阵,所述二级结构矩阵的每个元素表示对应二级结构的打开概率;
[0029]路径搜索模块,用于基于最优路径搜索算法从所述二级结构矩阵中选取一个或多个最优路径,并基于所述最优路径确定所有候选靶标序列。
[0030]可选地,所述特征包括如下至少一项:
[0031]回文结构、序列多态性、重复序列、翻译区起始点、编码区。
[0032]可选地,所述二级结构矩阵模块,用于将所述一级结构矩阵的每一列元素相加,得到所述1
×
N的矩阵;按照公式Pij=Pi
×
Pj的方式计算所述二级结构矩阵中的各个元素,将计算结果填入所述二级结构矩阵中;其中,Pij为所述二级结构矩阵中的第i行第j个元素,Pi为所述1
×
N的矩阵中的第i个元素,Pj为所述1
×
N的矩阵中的第j个元素,所述i、j均为[1,N]中的正整数。
[0033]可选地,所述路径搜索模块,用于基于n2个选择条件,得到n2个N
×
N的选择条件矩阵,所述选择条件矩阵的每个元素表示对应二级结构在对应条件下的分值,N、n1、n2均为正
整数;
[0034]将所述n2个N
×
N的选择条件矩阵降维处理成N
×
N的矩阵,并与所述N
×
N的二级结构矩阵相加,得到N
×
N的路径打分矩阵;
[0035]基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种靶点选择方法,其特征在于,所述方法包括:获取信使核糖核酸mRNA靶点序列和新一代测序NGS数据,所述mRNA靶点序列的长度为N,所述NGS数据为1
×
N的序列矩阵,所述序列矩阵的每个元素对应mRNA靶点序列的一个位点,所述序列矩阵的每个元素表示对应的位点在NGS实验中被N
20
片段杂合的次数;基于所述mRNA靶点序列生成n1
×
N的序列特征矩阵,所述序列特征矩阵的每一列元素对应mRNA靶点序列的一个位点,所述序列特征矩阵的每一列元素表示对应的位点的n1个特征;将所述序列矩阵和所述序列特征矩阵进行矩阵叠加,得到(n1+1)
×
N的一级结构矩阵;将所述一级结构矩阵降维处理成1
×
N的矩阵,并对所述1
×
N的矩阵进行对角化,得到N
×
N的二级结构矩阵,所述二级结构矩阵的每个元素表示对应二级结构的打开概率;基于最优路径搜索算法从所述二级结构矩阵中选取一个或多个最优路径,并基于所述最优路径确定所有候选靶标序列。2.根据权利要求1所述的方法,其特征在于,所述特征包括如下至少一项:回文结构、序列多态性、重复序列、翻译区起始点、编码区。3.根据权利要求1所述的方法,其特征在于,所述将所述一级结构矩阵降维处理成1
×
N的矩阵,并对所述1
×
N的矩阵进行对角化,得到N
×
N的二级结构矩阵,包括:将所述一级结构矩阵的每一列元素相加,得到所述1
×
N的矩阵;按照公式Pij=Pi
×
Pj的方式计算所述二级结构矩阵中的各个元素,将计算结果填入所述二级结构矩阵中;其中,Pij为所述二级结构矩阵中的第i行第j个元素,Pi为所述1
×
N的矩阵中的第i个元素,Pj为所述1
×
N的矩阵中的第j个元素,所述i、j均为[1,N]中的正整数。4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于最优路径搜索算法从所述二级结构矩阵中选取一个或多个最优路径,并基于所述最优路径确定所有候选靶标序列,包括:基于n2个选择条件,得到n2个N
×
N的选择条件矩阵,所述选择条件矩阵的每个元素表示对应二级结构在对应条件下的分值,N、n1、n2均为正整数;将所述n2个N
×
N的选择条件矩阵降维处理成N
×
N的矩阵,并与所述N
×
N的二级结构矩阵相加,得到N
×
N的路径打分矩阵;基于最优路径搜索算法从所述路径打分...

【专利技术属性】
技术研发人员:谢禹鑫陈盛培陈婉婷潘小瑜
申请(专利权)人:深圳市硬核酸生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1