抗体数据库的生成、更新和查询方法、装置及存储介质制造方法及图纸

技术编号:32503544 阅读:108 留言:0更新日期:2022-03-02 10:13
本发明专利技术公开了一种抗体数据库的生成、更新和查询方法、装置及存储介质。其中,该抗体数据库的生成方法包括:获取原始抗体的结构信息和序列信息;解析原始抗体的序列信息,对序列信息中的抗体序列进行抗体编号;若抗体编号成功,对原始抗体的结构信息进行数据清洗和结构优化,得到优化后的目标抗体的结构信息;根据目标抗体的结构信息生成抗体数据库。本发明专利技术解决了现有的抗体数据库中的抗体数据不完整,导致抗体数据库的使用体验差的技术问题。致抗体数据库的使用体验差的技术问题。致抗体数据库的使用体验差的技术问题。

【技术实现步骤摘要】
抗体数据库的生成、更新和查询方法、装置及存储介质


[0001]本专利技术涉及计算化学
,具体而言,涉及一种抗体数据库的生成、更新和查询方法、装置及存储介质。

技术介绍

[0002]数据库是按照数据结构进行组织、存储和管理数据的仓库,其是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。在化学领域,已经建立了一些公开的数据库用于存储抗体数据。
[0003]在实际应用中发现,现有的抗体数据库中存储的抗体数据的质量良莠不齐,甚至存在部分抗体结构数据不完整的情况,从而严重影响了对抗体数据库的使用。而且,现有的抗体数据库往往无法实时更新,导致数据库更新缓慢。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种抗体数据库的生成、更新和查询方法、装置及存储介质,以至少解决现有的抗体数据库中的抗体数据不完整,导致抗体数据库的使用体验差的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种抗体数据库的生成方法,包括:获取原本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种抗体数据库的生成方法,其特征在于,包括:获取原始抗体的结构信息和序列信息;解析所述原始抗体的序列信息,对所述序列信息中的抗体序列进行抗体编号;若抗体编号成功,对所述原始抗体的结构信息进行数据清洗和结构优化,得到优化后的目标抗体的结构信息;根据所述目标抗体的结构信息生成抗体数据库。2.根据权利要求1所述的生成方法,其特征在于,获取原始抗体的结构信息和序列信息,包括:根据检索关键词从蛋白质结构数据库中下载并获取与所述检索关键词相关联的抗体的结构信息和序列信息,并将获取到的抗体的结构信息和序列信息作为所述原始抗体的结构信息和序列信息。3.根据权利要求1所述的生成方法,其特征在于,所述方法还包括:若所述序列信息中存在一个或多个抗体序列编号失败,从所述序列信息中删除该编号失败的抗体序列。4.根据权利要求1所述的生成方法,其特征在于,在对所述原始抗体的结构信息进行数据清洗和结构优化之前,所述方法还包括:解析所述原始抗体中抗体编号成功的抗体序列对应的结构信息,得到对应的抗体链结构;对每条所述抗体链结构进行配对,得到配对结果,所述配对结果包括配对成功的抗体链结构组成的抗体以及无配对的抗体链结构形成的抗体;所述对所述原始抗体的结构信息进行数据清洗和结构优化,得到优化后的目标抗体的结构信息,包括:对配对后形成的各抗体的结构信息进行数据清洗和结构优化,得到优化后的各目标抗体的结构信息。5.根据权利要求4所述的生成方法,其特征在于,所述对每条所述抗体链结构进行配对,得到配对结果,包括:获取每条所述抗体链结构与其余抗体链结构之间的距离,根据所述距离对所述抗体链结构进行配对,得到所述配对结果;和/或获取每条所述抗体链结构与其余抗体链结构之间存在相互作用的目标原子的数量,根据所述目标原子的数量对所述抗体链结构进行配对,得到所述配对结果。6.根据权利要求4所述的生成方法,其特征在于,所述解析所述原始抗体中抗体编号成功的抗体序列对应的结构信息,得到对应的抗体链结构,包括:解析所述原始抗体中抗体编号成功的抗体序列对应的结构信息,若一条抗体序列中同时存在重链结构和轻链结构,对所述抗体序列进行结构切分为重链结构和轻链结构,以得到每条所述抗体序列对应的抗体链结构。7.根据权利要求1所述的生成方法,其特征在于,对所述原始抗体的结构信息进行数据清洗,包括以下至少一种操作:对所述原始抗体的抗体结构中的多重占位信息进行删除;对所述原始抗体的抗体结构中的无法被识别的预设残基进行删除处理;
将所述原始抗体的抗体结构中的非标准氨基酸转换为对应的标准氨基酸。8.根据权利要求1所述的生成方法,其特征在于,对所述原始抗体的结构信息进行结构优化,得到优化后的目标抗体的结构信息,包括:对经过数据清洗后的原始抗体的结构信息进行解析,得到对应的抗体结构序列;将所述抗体结构序列与所述序列信息中对应的抗体序列进行比对,确定所述抗体结构序列中的缺失部分;对所述缺失部分进行结构补全,并对补全后的抗体结构进行能量最小化处理,得到优化后的目标抗体的结构信息。9.根据权利要求8所述的生成方法,其特征在于,在对所述原始抗体的结构信息进行结构优化之后,所述方法还包括:对所述目标抗体的抗体结构序列进行抗体编号,以对所述原始抗体的抗体编号进行更新。10.根据权利要求1所述的生成方法,其特征在于,在根据所述目标抗体的结构信息生成抗体数据库之前,所述方法还包括:检测所述目标抗体中的主链结构是否发生断裂;若所述主链结构发生断裂,利用预设结构参数对所述主链结构进行结构修复,得到修复后的目标抗体;所述根据所述目标抗体的结构信息生成抗体数据库,包括:利用所述修复后的目标抗体的结构信息生成所述抗体数据库。11.根据权利要求1所述的生成方法,其特征在于,在根据所述目标抗体的结构信息生成抗体数据库之前,所述方法还包括:检测所述目标抗体的抗体编号是否存在异常;若抗体编号存在异常,删除抗体编号异常的目标抗体,得到抗体编号正常的目标抗体;所述根据所述目标抗体的结构信息生成抗体数据库,包括:利用所述抗体编号正常的目标抗体的结构信息生成抗体数据库。12.根据权利要求1

11任一项所述的生成方法,其特征在于,所述抗体数据库包括抗体结构数据库、抗体特征数据库和抗体序列数据库中的至少一种。13.根据权利要求12所述的生成方法,其特征在于,当所述抗体数据库包括所...

【专利技术属性】
技术研发人员:王天元吴炜坤黄健
申请(专利权)人:北京晶泰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1