基于卷积神经网络的智能化先导化合物发现方法技术

技术编号:15691281 阅读:186 留言:0更新日期:2017-06-24 04:21
本发明专利技术公开了基于卷积神经网络的图像识别系统用于药物先导化合物发现的新方法,以解决当前先导化合物虚拟筛选效率低、准确度不高的问题。该方法首先将化合物结构式转为平面图片,并进行黑白化与反色处理,所有图片根据化合物的活性属性分类并根据类别分别加以数字标签,输入系统。选取一部分图片作为训练集供卷积神经网络对分类问题进行深度学习,剩余部分作为测试集以评价模型。学习完成后,输入训练集及测试集以外的经同样处理的图片供系统计算,预测其对应的活性属性的概率。

Intelligent lead compound discovery method based on convolution neural network

The invention discloses an image recognition system based on a convolution neural network, which is a new method for discovering a drug lead compound, so as to solve the problems of low efficiency and low accuracy of the current leader compound virtual screening. Firstly, a compound of the formula to graphic images, and the black and white and color processing, all images according to the active compounds and attribute classification according to category to digital label input system. Some pictures are selected as training sets for convolutional neural networks, and depth learning is performed on the classification problem. The remaining part is used as a test set to evaluate the model. After the completion of the study, the same set of pictures other than the training set and the test set are input into the system to predict the probability of the corresponding active attributes.

【技术实现步骤摘要】
基于卷积神经网络的智能化先导化合物发现方法
本专利技术涉及先导化合物发现的方法,属于以先导化合物发现为目标的人工智能应用
,目的是高效、智能地发现小分子先导化合物。
技术介绍
基于相似性的活性化合物发现策略在药物设计中具有重要的地位,包括了生物电子等排体策略、骨架跃迁策略等等,但这两种方法均在很大程度上依赖于药物研发人员长期积累的经验。而人工智能通过深度学习,能快速、准确地总结出规律,这一过程得以加快药物的发现过程。尤其是借助计算机的高速运算及大存储量这两个人类不具有的优势,人工智能得以快速、准确地识别活性分子,找出活性与结构之间的关系。活性分子相似性的发现,需要借助图像识别这一技术。卷积神经网络则是实现智能读图的重要技术之一。通过建立卷积神经网络结构,并提供已知特性的图像供该网络结构训练。拟合出对应于该特性的系列参数,最终达到该网络能准确分类该特性的目的。目前,我国的新药开发正在朝着全新的创新药物方向发展,而新药开发过程中先导化合物的发现是关键的一步,虽然先导化合物并非药物,却是药物之母。面对着难以计数的全新化学实体,如果一一进行活性测试将花费极其巨大的人力物力及财力。因此,本文档来自技高网...
基于卷积神经网络的智能化先导化合物发现方法

【技术保护点】
基于卷积神经网络的智能化先导化合物发现方法,其特征在于,该方法包括如下步骤:步骤1:对大小、亮度均一致的化合物结构式的平面图片进行黑白化与反色处理;步骤2:根据化合物活性属性对图片进行分类,并对每一类图片加以各类所对应的数字标签,其中一部分图片作为训练集,剩余部分图片作为测试集;步骤3:将图片根据像素值转变为数字矩阵,与标签数字一一对应;步骤4:建立卷积神经网络分类器,并调整参数;步骤5:当评价模型的损失函数值逼近0后,完成训练,获得训练后的矩阵参数;步骤6:以获得的矩阵计算测试集图片最为可能的活性属性,并通过与其真实属性比较对模型进行评估,若评估结果不合要求,扩充数据集大小,重复上述过程;步...

【技术特征摘要】
1.基于卷积神经网络的智能化先导化合物发现方法,其特征在于,该方法包括如下步骤:步骤1:对大小、亮度均一致的化合物结构式的平面图片进行黑白化与反色处理;步骤2:根据化合物活性属性对图片进行分类,并对每一类图片加以各类所对应的数字标签,其中一部分图片作为训练集,剩余部分图片作为测试集;步骤3:将图片根据像素值转变为数字矩阵,与标签数字一一对应;步骤4:建立卷积神经网络分类器,并调整参数;步骤5:当评价模型的损失函数值逼近0后,完成训练,获得训练后的矩阵参数;步骤6:以获得的矩阵计算测试集图片最为可能的活性属性,并通过与其真实属性比较对模型进行评估,若评估结果不合要求,扩充数据集大小,重复上述过程;步骤7:若评估结果符合要求,依前法对待预测化合物结构式图片进行预处理,将图片以保存的矩阵运算后输出其属于各活性类别的可能性。2.根据权利要求1所述的基于卷积神经网络的智能化先导化合物发现方法,其特征在于:步骤1、2、3、6、7中所述图片的准备方法是指将分子化学结构式转变为平面图片。3.根据权利要求1所述的基于卷积神经网络的智能化先导化合物发现方法,其特征在于:步骤2中所述活性属性包括定性的活性属...

【专利技术属性】
技术研发人员:林克江徐吟秋
申请(专利权)人:中国药科大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1