一种数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27480781 阅读:16 留言:0更新日期:2021-03-02 17:51
本申请公开了一种数据处理方法、装置、计算机设备和存储介质,该方法包括:获取参考蛋白物质的蛋白属性信息;参考蛋白物质包括蛋白调整区域;将蛋白属性信息输入蛋白预测模型,在蛋白预测模型中生成参考蛋白物质的蛋白调整区域处的预测蛋白片段;蛋白预测模型基于靶点蛋白物质训练得到;蛋白预测模型用于预测与靶点蛋白物质相结合的蛋白物质;在蛋白片段数据库中匹配预测蛋白片段的相似蛋白片段;对相似蛋白片段和参考蛋白物质进行虚拟合成,得到合成物质辅助信息;合成物质辅助信息用于辅助生成与靶点蛋白物质相结合的抗体蛋白物质。采用本申请,可提高获取抗体蛋白物质的效率。可提高获取抗体蛋白物质的效率。可提高获取抗体蛋白物质的效率。

【技术实现步骤摘要】
一种数据处理方法、装置、计算机设备和存储介质


[0001]本申请涉及数据处理的
,尤其涉及一种数据处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]靶点蛋白为一种致病的蛋白质,在设计用于与靶点蛋白相结合的抗体蛋白时,通常可以对人体中原本存在的参考抗体蛋白进行改造,改造后的参考抗体蛋白即为用于与靶点蛋白相结合的抗体蛋白。
[0003]其中,可以采用短肽数据库中的短肽对参考抗体蛋白进行改造,该短肽数据库中可以包括从大自然中所采集到的若干个短肽,一个短肽为一个蛋白片段。现有技术中,通常可以不断随机地从短肽数据库中选取短肽来对参考抗体蛋白进行改造,每通过一个短肽对参考抗体蛋白进行改造后,就需要评估所改造的参考抗体蛋白是否满足与靶点蛋白相结合的标准,直到评估出所改造的参考抗体蛋白满足与靶点蛋白相结合的标准时,才会停止从短肽数据库中选取短肽对参考抗体蛋白进行改造。
[0004]由此可见,现有技术中,选取对参考抗体蛋白进行改造的短肽的随机性极大,这就导致很有可能需要通过大量的短肽对参考抗体蛋白进行改造后,才能得到改造后的满足与靶点蛋白相结合的标准的参考抗体蛋白,从而导致获取用于与靶点蛋白物质相结合的抗体蛋白的效率低。

技术实现思路

[0005]本申请提供了一种数据处理方法、装置、计算机设备和存储介质,可提高获取抗体蛋白物质的效率。
[0006]本申请一方面提供了一种数据处理方法,包括:获取参考蛋白物质的蛋白属性信息;参考蛋白物质包括蛋白调整区域;将蛋白属性信息输入蛋白预测模型,在蛋白预测模型中生成参考蛋白物质的蛋白调整区域处的预测蛋白片段;蛋白预测模型基于靶点蛋白物质训练得到;蛋白预测模型用于预测与靶点蛋白物质相结合的蛋白物质;在蛋白片段数据库中匹配预测蛋白片段的相似蛋白片段;对相似蛋白片段和参考蛋白物质进行虚拟合成,得到合成物质辅助信息;合成物质辅助信息用于辅助生成与靶点蛋白物质相结合的抗体蛋白物质。
[0007]本申请一方面提供了一种数据处理装置,包括:属性获取模块,用于获取参考蛋白物质的蛋白属性信息;参考蛋白物质包括蛋白调整区域;预测片段生成模块,用于将蛋白属性信息输入蛋白预测模型,在蛋白预测模型中生成参考蛋白物质的蛋白调整区域处的预测蛋白片段;蛋白预测模型基于靶点蛋白物质训练得到;蛋白预测模型用于预测与靶点蛋白物质相结合的蛋白物质;
片段匹配模块,用于在蛋白片段数据库中匹配预测蛋白片段的相似蛋白片段;物质合成模块,用于对相似蛋白片段和参考蛋白物质进行虚拟合成,得到合成物质辅助信息;合成物质辅助信息用于辅助生成与靶点蛋白物质相结合的抗体蛋白物质。
[0008]其中,属性获取模块,包括:氨基酸获取单元,用于获取参考蛋白物质所包含的至少两个氨基酸;信息获取单元,用于获取至少两个氨基酸中每个氨基酸的氨基酸结构信息和每个氨基酸的氨基酸扭转角信息;属性确定单元,用于将每个氨基酸的氨基酸结构信息和每个氨基酸的氨基酸扭转角信息,确定为参考蛋白物质的蛋白属性信息。
[0009]其中,预测片段生成模块,包括:氨基酸确定单元,用于将参考蛋白物质的蛋白调整区域处的氨基酸,确定为调整氨基酸;结构生成单元,用于在蛋白预测模型中,生成调整氨基酸对应的预测结构信息;扭转角生成单元,用于在蛋白预测模型中,生成调整氨基酸对应的预测扭转角信息;预测片段确定单元,用于根据调整氨基酸对应的预测结构信息和预测扭转角信息,确定预测蛋白片段。
[0010]其中,结构生成单元,包括:第一概率确定子单元,用于在蛋白预测模型中,确定调整氨基酸在至少两个氨基酸结构维度的每个氨基酸结构维度上的采样概率;第一维度确定子单元,用于将至少两个氨基酸结构维度中最大的采样概率所属的氨基酸结构维度,确定为目标结构维度;结构生成子单元,用于在目标结构维度上进行结构参数采样,生成调整氨基酸的预测结构信息。
[0011]其中,扭转角生成单元,包括:第二概率确定子单元,用于在蛋白预测模型中,确定调整氨基酸在至少两个氨基酸扭转角维度的每个氨基酸扭转角维度上的采样概率;第二维度确定单元,用于将至少两个氨基酸扭转角维度中最大的采样概率所属的氨基酸扭转角维度,确定为目标扭转角维度;扭转角生成子单元,用于在目标扭转角维度上进行扭转角参数采样,生成调整氨基酸的预测扭转角信息。
[0012]其中,片段匹配模块,包括:权重获取单元,用于获取针对预测结构信息的结构权重,获取针对预测扭转角信息的扭转角权重;片段匹配单元,用于根据结构权重、扭转角权重、预测结构信息和预测扭转角信息,在蛋白片段数据库中匹配预测蛋白片段的相似蛋白片段。
[0013]其中,物质合成模块,包括:切割单元,用于对参考蛋白物质在蛋白调整区域处的蛋白片段进行切割,得到切割后的参考蛋白物质;合成单元,用于对切割后的参考蛋白物质和相似蛋白片段进行虚拟合成,得到合成物
质辅助信息。
[0014]其中,上述数据处理装置,还包括:类型识别模块,用于识别靶点蛋白物质的靶点蛋白类型;区域确定模块,用于根据靶点蛋白类型,确定参考蛋白物质中的蛋白调整区域。
[0015]其中,靶点蛋白物质为第三方设备所提供;上述数据处理装置,还包括:文件生成模块,用于生成合成物质辅助信息的可视化程序文件;文件发送模块,用于将可视化程序文件发送给第三方设备,以使第三方设备输出可视化程序文件。
[0016]其中,上述装置还包括:样本片段生成模块,用于将蛋白属性信息输入初始预测模型,在初始预测模型的第n次训练过程中,生成蛋白调整区域处的样本预测蛋白片段;样本片段匹配模块,用于在蛋白片段数据库中匹配样本预测蛋白片段的样本相似蛋白片段;样本合成模块,用于对参考蛋白物质和样本相似蛋白片段进行虚拟合成,得到样本合成物质辅助信息;样本合成物质辅助信息用于辅助生成与靶点蛋白物质相结合的样本抗体蛋白物质k
n
;第一强度获取模块,用于获取样本抗体蛋白物质k
n
与靶点蛋白物质之间的样本结合强度q
n
;第二强度获取模块,用于获取在初始预测模型的第n-1次训练过程中,针对靶点蛋白物质的样本抗体蛋白物质k
n-1
与靶点蛋白物质之间的样本结合强度q
n-1
;参数修正模块,用于根据样本结合强度q
n
和样本结合强度q
n-1
,修正初始预测模型的模型参数,得到蛋白预测模型。
[0017]其中,样本相似蛋白片段的数量为至少两个;一个样本相似蛋白片段对应于一个样本抗体蛋白物质k
n
;第一强度获取模块,包括:靶点强度获取单元,用于获取至少两个样本抗体蛋白物质k
n
分别与靶点蛋白物质之间的靶点结合强度;平均强度获取单元,用于将至少两个样本抗体蛋白物质k
n
分别对应的靶点结合强度的平均强度,确定为样本结合强度q
n

[0018]其中,参数修正模块,包括:平方差获取单元,用于获取样本结合强度q
n本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取参考蛋白物质的蛋白属性信息;所述参考蛋白物质包括蛋白调整区域;将所述蛋白属性信息输入蛋白预测模型,在所述蛋白预测模型中生成所述参考蛋白物质的所述蛋白调整区域处的预测蛋白片段;所述蛋白预测模型基于靶点蛋白物质训练得到;所述蛋白预测模型用于预测与所述靶点蛋白物质相结合的蛋白物质;在蛋白片段数据库中匹配所述预测蛋白片段的相似蛋白片段;对所述相似蛋白片段和所述参考蛋白物质进行虚拟合成,得到合成物质辅助信息;所述合成物质辅助信息用于辅助生成与所述靶点蛋白物质相结合的抗体蛋白物质。2.根据权利要求1所述的方法,其特征在于,所述获取参考蛋白物质的蛋白属性信息,包括:获取所述参考蛋白物质所包含的至少两个氨基酸;获取所述至少两个氨基酸中每个氨基酸的氨基酸结构信息和所述每个氨基酸的氨基酸扭转角信息;将所述每个氨基酸的氨基酸结构信息和所述每个氨基酸的氨基酸扭转角信息,确定为所述参考蛋白物质的所述蛋白属性信息。3.根据权利要求2所述的方法,其特征在于,所述在所述蛋白预测模型中生成所述参考蛋白物质的所述蛋白调整区域处的预测蛋白片段,包括:将所述参考蛋白物质的所述蛋白调整区域处的氨基酸,确定为调整氨基酸;在所述蛋白预测模型中,生成所述调整氨基酸对应的预测结构信息;在所述蛋白预测模型中,生成所述调整氨基酸对应的预测扭转角信息;根据所述调整氨基酸对应的所述预测结构信息和所述预测扭转角信息,确定所述预测蛋白片段。4.根据权利要求3所述的方法,其特征在于,所述在所述蛋白预测模型中,生成所述调整氨基酸对应的预测结构信息,包括:在所述蛋白预测模型中,确定所述调整氨基酸在至少两个氨基酸结构维度的每个氨基酸结构维度上的采样概率;将所述至少两个氨基酸结构维度中最大的采样概率所属的氨基酸结构维度,确定为目标结构维度;在所述目标结构维度上进行结构参数采样,生成所述调整氨基酸的所述预测结构信息。5.根据权利要求3所述的方法,其特征在于,所述在所述蛋白预测模型中,生成所述调整氨基酸对应的预测扭转角信息,包括:在所述蛋白预测模型中,确定所述调整氨基酸在至少两个氨基酸扭转角维度的每个氨基酸扭转角维度上的采样概率;将所述至少两个氨基酸扭转角维度中最大的采样概率所属的氨基酸扭转角维度,确定为目标扭转角维度;在所述目标扭转角维度上进行扭转角参数采样,生成所述调整氨基酸的所述预测扭转角信息。6.根据权利要求3所述的方法,其特征在于,所述在蛋白片段数据库中匹配所述预测蛋
白片段的相似蛋白片段,包括:获取针对所述预测结构信息的结构权重,获取针对所述预测扭转角信息的扭转角权重;根据所述结构权重、所述扭转角权重、所述预测结构信息和所述预测扭转角信息,在所述蛋白片段数据库中匹配所述预测蛋白片段的所述相似蛋白片段。7.根据权利要求1所述的方法,其特征在于,所述对所述相似蛋白片段和所述参考蛋白物质进行虚拟合成,得到合成物质辅助信息,包括:对所述参考蛋白物质在所述蛋白调整区域处的蛋白片段进行切割,得到切割后的所述参考蛋白物质;对切割后的所述参考蛋白物质和所述相似蛋白片段进行虚拟合成,得到所述合成物质辅助信息。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:识别所述靶点蛋白物质的靶点蛋白类型;根据所述靶点蛋白类型,确定所述参考蛋白物质中的所述蛋白调整区域。9.根据权利要求1所述的方法,其特征在于,所述靶点蛋白物质为第三方设备所提供;所述方法还包括:生成所述合成物质辅助信息的可视化程序文件;将所述可视化程序文件...

【专利技术属性】
技术研发人员:裴建国刘伟黄俊洲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1