The invention discloses an image recognition system based on a convolution neural network, which is a new method for discovering a drug lead compound, so as to solve the problems of low efficiency and low accuracy of the current leader compound virtual screening. Firstly, a compound of the formula to graphic images, and the black and white and color processing, all images according to the active compounds and attribute classification according to category to digital label input system. Some pictures are selected as training sets for convolutional neural networks, and depth learning is performed on the classification problem. The remaining part is used as a test set to evaluate the model. After the completion of the study, the same set of pictures other than the training set and the test set are input into the system to predict the probability of the corresponding active attributes.
【技术实现步骤摘要】
基于卷积神经网络的智能化先导化合物发现方法
本专利技术涉及先导化合物发现的方法,属于以先导化合物发现为目标的人工智能应用
,目的是高效、智能地发现小分子先导化合物。
技术介绍
基于相似性的活性化合物发现策略在药物设计中具有重要的地位,包括了生物电子等排体策略、骨架跃迁策略等等,但这两种方法均在很大程度上依赖于药物研发人员长期积累的经验。而人工智能通过深度学习,能快速、准确地总结出规律,这一过程得以加快药物的发现过程。尤其是借助计算机的高速运算及大存储量这两个人类不具有的优势,人工智能得以快速、准确地识别活性分子,找出活性与结构之间的关系。活性分子相似性的发现,需要借助图像识别这一技术。卷积神经网络则是实现智能读图的重要技术之一。通过建立卷积神经网络结构,并提供已知特性的图像供该网络结构训练。拟合出对应于该特性的系列参数,最终达到该网络能准确分类该特性的目的。目前,我国的新药开发正在朝着全新的创新药物方向发展,而新药开发过程中先导化合物的发现是关键的一步,虽然先导化合物并非药物,却是药物之母。面对着难以计数的全新化学实体,如果一一进行活性测试将花费极其巨大的人力物力及财力。因此,借助于人工智能卷积神经网络将加快药物先导化合物的发现,是新药研发的有效辅助手段。
技术实现思路
本专利技术的目的是提供一种基于化合物化学结构式的智能识别系统,一种活性先导化合物发现方法。用于解决当前先导化合物发现效率低、方法有限的问题。该方法通过卷积神经网络,对具有各类不同活性属性的化合物结构式图像的学习,拟合出准确分类的矩阵参数,并将参数用于未知活性属性的化合物的预测。本专利技术 ...
【技术保护点】
基于卷积神经网络的智能化先导化合物发现方法,其特征在于,该方法包括如下步骤:步骤1:对大小、亮度均一致的化合物结构式的平面图片进行黑白化与反色处理;步骤2:根据化合物活性属性对图片进行分类,并对每一类图片加以各类所对应的数字标签,其中一部分图片作为训练集,剩余部分图片作为测试集;步骤3:将图片根据像素值转变为数字矩阵,与标签数字一一对应;步骤4:建立卷积神经网络分类器,并调整参数;步骤5:当评价模型的损失函数值逼近0后,完成训练,获得训练后的矩阵参数;步骤6:以获得的矩阵计算测试集图片最为可能的活性属性,并通过与其真实属性比较对模型进行评估,若评估结果不合要求,扩充数据集大小,重复上述过程;步骤7:若评估结果符合要求,依前法对待预测化合物结构式图片进行预处理,将图片以保存的矩阵运算后输出其属于各活性类别的可能性。
【技术特征摘要】
1.基于卷积神经网络的智能化先导化合物发现方法,其特征在于,该方法包括如下步骤:步骤1:对大小、亮度均一致的化合物结构式的平面图片进行黑白化与反色处理;步骤2:根据化合物活性属性对图片进行分类,并对每一类图片加以各类所对应的数字标签,其中一部分图片作为训练集,剩余部分图片作为测试集;步骤3:将图片根据像素值转变为数字矩阵,与标签数字一一对应;步骤4:建立卷积神经网络分类器,并调整参数;步骤5:当评价模型的损失函数值逼近0后,完成训练,获得训练后的矩阵参数;步骤6:以获得的矩阵计算测试集图片最为可能的活性属性,并通过与其真实属性比较对模型进行评估,若评估结果不合要求,扩充数据集大小,重复上述过程;步骤7:若评估结果符合要求,依前法对待预测化合物结构式图片进行预处理,将图片以保存的矩阵运算后输出其属于各活性类别的可能性。2.根据权利要求1所述的基于卷积神经网络的智能化先导化合物发现方法,其特征在于:步骤1、2、3、6、7中所述图片的准备方法是指将分子化学结构式转变为平面图片。3.根据权利要求1所述的基于卷积神经网络的智能化先导化合物发现方法,其特征在于:步骤2中所述活性属性包括定性的活性属...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。