基于数据库的三维结构检索方法、电子设备及存储介质技术

技术编号:21037434 阅读:26 留言:0更新日期:2019-05-04 06:49
本发明专利技术公开了基于数据库的三维结构检索方法,包括如下步骤:获取库分子的三维形状特征信息,根据三维形状特征信息建立基于C语言的库分子高斯表达;根据数据库的预设扩展格式将C语言的高斯表达处理为相应的多种检索扩展表达,形成检索扩展表达集;读入待检索分子的三维形状特征信息,生成相应的待检索分子高斯表达;将待检索分子高斯表达与检索扩展表达集进行匹配,以选取数据库中与待检索分子的高斯表达匹配度最高的库分子。本发明专利技术通过构建分子三维结构的高斯表达以及检索扩展表达集,对待检索分子进行子结构和边链进行匹配比较,从而可以筛选出相似度最高的三维结构。

【技术实现步骤摘要】
基于数据库的三维结构检索方法、电子设备及存储介质
本专利技术涉及分子三维结构检索技术,尤其涉及基于数据库的三维结构检索方法、电子设备及存储介质。
技术介绍
PostgreSQL是常用的关系型数据库,但目前并没有实现化学结构检索,特别是三维结构的相似性检索模块。在使用PostgreSQL数据库构建大规模化学结构库时,无法实现快速的分子三维相似度的检索查询,进而无法实现快速高效的基于分子三维相似性的大规模药物虚拟筛选、靶点预测等功能。
技术实现思路
为了克服现有技术的不足,本专利技术的目的之一在于提供基于数据库的三维结构检索方法,其能解决现有技术无法对三维结构相似性进行检索的问题。本专利技术的目的之二在于提供一种电子设备,其能解决现有技术无法对三维结构相似性进行检索的问题。本专利技术的目的之三在于提供一种存储介质,其能解决现有技术无法对三维结构相似性进行检索的问题。本专利技术的目的之一采用以下技术方案实现:基于数据库的三维结构检索方法,包括如下步骤:创建步骤:获取库分子的三维形状特征信息,根据所述三维形状特征信息建立基于C语言的库分子高斯表达,所述库分子包括第一子结构及第一边链;所述库分子高斯表达包括第一子结构信息和第一边链信息;处理步骤:根据数据库的预设扩展格式将所述C语言的高斯表达处理为相应的多种检索扩展表达,形成检索扩展表达集;读入步骤:读入待检索分子的三维形状特征信息,生成相应的待检索分子高斯表达;待检索分子包括第二子结构及第二边链;待检索分子高斯表达包括第二子结构信息和第二边链信息;匹配步骤:将待检索分子高斯表达与检索扩展表达集进行匹配,以选取数据库中与待检索分子的高斯表达匹配度最高的库分子。优选的,在创建步骤中,三维形状特征信息包括第一子结构的自身重量、体积以及第一边链的自身重量和体积。优选的,在匹配步骤中,“将待检索分子高斯表达与检索扩展表达集进行匹配”具体为:将待检索分子高斯表达中的第二子结构信息与检索扩展表达集中的第一子结构信息进行比对,计算得到第一相似度;将待检索分子高斯表达中的第二边链信息与检索扩展表达集中的第一边链信息进行比对,计算得到第二相似度;将第一相似度和第二相似度进行加权平均计算得到综合相似度,根据所述综合相似度进行匹配。优选的,在匹配步骤中,所述匹配度最高为综合相似度最高。本专利技术的目的之二采用以下技术方案:一种电子设备,包括存储器、处理器以及存储在存储器中,并可被处理器执行的计算机程序,所述计算机程序被处理器执行时实现如下步骤:创建步骤:获取库分子的三维形状特征信息,根据所述三维形状特征信息建立基于C语言的库分子高斯表达,所述库分子包括第一子结构及第一边链;所述库分子高斯表达包括第一子结构信息和第一边链信息;处理步骤:根据数据库的预设扩展格式将所述C语言的高斯表达处理为相应的多种检索扩展表达,形成检索扩展表达集;读入步骤:读入待检索分子的三维形状特征信息,生成相应的待检索分子高斯表达;待检索分子包括第二子结构及第二边链;待检索分子高斯表达包括第二子结构信息和第二边链信息;匹配步骤:将待检索分子高斯表达与检索扩展表达集进行匹配,以选取数据库中与待检索分子的高斯表达匹配度最高的库分子。优选的,在创建步骤中,三维形状特征信息包括第一子结构的自身重量、体积以及第一边链的自身重量和体积。优选的,在匹配步骤中,“将待检索分子高斯表达与检索扩展表达集进行匹配”具体为:将待检索分子高斯表达中的第二子结构信息与检索扩展表达集中的第一子结构信息进行比对,计算得到第一相似度;将待检索分子高斯表达中的第二边链信息与检索扩展表达集中的第一边链信息进行比对,计算得到第二相似度;将第一相似度和第二相似度进行加权平均计算得到综合相似度,根据所述综合相似度进行匹配。优选的,在匹配步骤中,所述匹配度最高为综合相似度最高。本专利技术的目的之三采用以下技术方案实现:一种存储介质,其上存储有可被处理器执行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现如本专利技术目的之一所述的三维结构检索方法。相比现有技术,本专利技术的有益效果在于:本专利技术通过构建分子三维结构的高斯表达以及检索扩展表达集,对待检索分子进行子结构和边链进行匹配比较,从而可以筛选出相似度最高的三维结构。附图说明图1为本专利技术的基于数据库的三维结构检索方法的流程图。具体实施方式下面,结合附图以及具体实施方式,对本专利技术做进一步描述:如图1所示,本专利技术提供一种基于数据库的三维结构检索方法,其特征在于,包括如下步骤:S1:获取库分子的三维形状特征信息,根据所述三维形状特征信息建立基于C语言的库分子高斯表达,所述库分子包括第一子结构及第一边链;所述库分子高斯表达包括第一子结构信息和第一边链信息;本专利技术首先使用C语言函数实现对分子的三维形状的高斯表达。S2:根据数据库的预设扩展格式将所述C语言的高斯表达处理为相应的多种检索扩展表达,形成检索扩展表达集;按照步骤S1的高斯表达进行预设各种的修改和调速,完成PostgreSQL数据库分子三维相似性检索扩展表达集的构建。并将该检索扩展表达集加载到1的高斯表达进行预设各种的修改和调速,完成S3:读入待检索分子的三维形状特征信息,生成相应的待检索分子高斯表达;待检索分子包括第二子结构及第二边链;待检索分子高斯表达包括第二子结构信息和第二边链信息;S4:将待检索分子高斯表达与检索扩展表达集进行匹配,以选取数据库中与待检索分子的高斯表达匹配度最高的库分子。具体来讲,在步骤S1中,三维形状特征信息包括第一子结构的自身重量、体积以及第一边链的自身重量和体积。基于此,更进一步的,本专利技术的S4不尊重的“将待检索分子高斯表达与检索扩展表达集进行匹配”具体为:将待检索分子高斯表达中的第二子结构信息与检索扩展表达集中的第一子结构信息进行比对,计算得到第一相似度;将待检索分子高斯表达中的第二边链信息与检索扩展表达集中的第一边链信息进行比对,计算得到第二相似度;将第一相似度和第二相似度进行加权平均计算得到综合相似度,根据所述综合相似度进行匹配。因此匹配度最高则为综合相似度最高。本专利技术还提供一种电子设备,包括存储器、处理器以及存储在存储器中,并可被处理器执行的计算机程序,所述计算机程序被处理器执行时实现如下步骤:创建步骤:获取库分子的三维形状特征信息,根据所述三维形状特征信息建立基于C语言的库分子高斯表达,所述库分子包括第一子结构及第一边链;所述库分子高斯表达包括第一子结构信息和第一边链信息;处理步骤:根据数据库的预设扩展格式将所述C语言的高斯表达处理为相应的多种检索扩展表达,形成检索扩展表达集;读入步骤:读入待检索分子的三维形状特征信息,生成相应的待检索分子高斯表达;待检索分子包括第二子结构及第二边链;待检索分子高斯表达包括第二子结构信息和第二边链信息;匹配步骤:将待检索分子高斯表达与检索扩展表达集进行匹配,以选取数据库中与待检索分子的高斯表达匹配度最高的库分子。其中,在创建步骤中,三维形状特征信息包括第一子结构的自身重量、体积以及第一边链的自身重量和体积。在匹配步骤中,“将待检索分子高斯表达与检索扩展表达集进行匹配”具体为:将待检索分子高斯表达中的第二子结构信息与检索扩展表达集中的第一子结构信息进行比对,计算得到第一相似度;将待检索分子高斯表达中的第二边链本文档来自技高网...

【技术保护点】
1.基于数据库的三维结构检索方法,其特征在于,包括如下步骤:创建步骤:获取库分子的三维形状特征信息,根据所述三维形状特征信息建立基于C语言的库分子高斯表达,所述库分子包括第一子结构及第一边链;所述库分子高斯表达包括第一子结构信息和第一边链信息;处理步骤:根据数据库的预设扩展格式将所述C语言的高斯表达处理为相应的多种检索扩展表达,形成检索扩展表达集;读入步骤:读入待检索分子的三维形状特征信息,生成相应的待检索分子高斯表达;待检索分子包括第二子结构及第二边链;待检索分子高斯表达包括第二子结构信息和第二边链信息;匹配步骤:将待检索分子高斯表达与检索扩展表达集进行匹配,以选取数据库中与待检索分子的高斯表达匹配度最高的库分子。

【技术特征摘要】
1.基于数据库的三维结构检索方法,其特征在于,包括如下步骤:创建步骤:获取库分子的三维形状特征信息,根据所述三维形状特征信息建立基于C语言的库分子高斯表达,所述库分子包括第一子结构及第一边链;所述库分子高斯表达包括第一子结构信息和第一边链信息;处理步骤:根据数据库的预设扩展格式将所述C语言的高斯表达处理为相应的多种检索扩展表达,形成检索扩展表达集;读入步骤:读入待检索分子的三维形状特征信息,生成相应的待检索分子高斯表达;待检索分子包括第二子结构及第二边链;待检索分子高斯表达包括第二子结构信息和第二边链信息;匹配步骤:将待检索分子高斯表达与检索扩展表达集进行匹配,以选取数据库中与待检索分子的高斯表达匹配度最高的库分子。2.如权利要求1所述的三维结构检索方法,其特征在于,在创建步骤中,三维形状特征信息包括第一子结构的自身重量、体积以及第一边链的自身重量和体积。3.如权利要求2所述的三维结构检索方法,其特征在于,在匹配步骤中,“将待检索分子高斯表达与检索扩展表达集进行匹配”具体为:将待检索分子高斯表达中的第二子结构信息与检索扩展表达集中的第一子结构信息进行比对,计算得到第一相似度;将待检索分子高斯表达中的第二边链信息与检索扩展表达集中的第一边链信息进行比对,计算得到第二相似度;将第一相似度和第二相似度进行加权平均计算得到综合相似度,根据所述综合相似度进行匹配。4.如权利要求3所述的三维结构检索方法,其特征在于,在匹配步骤中,所述匹配度最高为综合相似度最高。5.一种电子设备,包括存储器、处理器以及存储在存储器中,并可被处理器执行的计算机程序,其特征在于,所...

【专利技术属性】
技术研发人员:严鑫张德康林永胜刘志红
申请(专利权)人:广州市爱菩新医药科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1