一种基于深度学习的快速精准高通量药物筛选系统技术方案

技术编号:18445355 阅读:20 留言:0更新日期:2018-07-14 10:33
本发明专利技术公开一种基于深度学习的快速精准高通量药物筛选系统,所述药物筛选系统包括图片预处理模块、神经网络模块,所述图片预处理模块包括通道合并模块、图片标准化模块;通道合并模块将不同的细胞单颜色通道图片合并为多通道图片表示,合并后的图片张量表示为[H,W,C];图片标准化模块将输入的多通道图片数据标准化为[70,70,C]的张量表示;神经网络模块承接图片标准化模块,其输入数据为经过标准化的图片张量,经过已经训练完成的神经网络得到最终的预测分类判断。本发明专利技术建立的基于深度学习的药物筛选体系DeepScreen具有高通量、精准、高效、快速便捷、低成本和抗干扰的优势,有着值得关注的实践应用前景。

A fast and accurate high throughput drug screening system based on deep learning

The invention discloses a fast and accurate high throughput drug screening system based on deep learning. The drug screening system includes a picture preprocessing module and a neural network module. The picture preprocessing module includes a channel merging module and a picture standardization module, and the channel merging module combines different cells with single color channel pictures. The combined picture tensor is expressed as [H, W, C] for multi-channel images. The picture standardization module standardized the input multichannel picture data into [70,70 and C] tensor; the neural network module took the picture standardization module, and the input data was a standardized picture tensor, and the neural network has been trained to complete the neural network. The network gets the final prediction classification judgment. The drug screening system based on depth learning based on this invention has the advantages of high throughput, precision, high efficiency, fast and convenient, low cost and anti-interference, and has the prospect of practical application which is worth paying attention to.

【技术实现步骤摘要】
一种基于深度学习的快速精准高通量药物筛选系统
本专利技术涉及生物医药
,具体地说,是一种基于深度学习的快速精准高通量药物筛选系统。
技术介绍
据统计,每个新药上市的研发,测试到上市,均需要耗费10-14年,耗资2亿美元以上,如何加快新药的发现测试速度,一直是加快药物研发阶段的关键和难点。近年来,生物化学、生理病理学等学科的发展,提供了药物筛选的新手段,出现了一些分子细胞水平的药物筛选模型,并配合更先进的检测技术、自动化技术的和计算机技术的发展,在90年代末期发展出了高通量筛选技术(Highthroughputscreening,HTS)。HTS主要依赖于自动化的操作系统,即实验室机器人和高灵敏度的检测过程,包括分光光度法和荧光检测技术等方法。HTS的出现,大大加快了药筛选速度,但是其仍然有很大的局限性,包括成本高、模型搭建困难,模型数量有限,我国在药物筛选体系的发展中起步较晚,仅有个别国家重点实验室具有高通量筛选的系统,实验室机器人由于其成本高而难以普及,各种检测手段仍然不能脱离人工的统计和分析。而近年来,伴随着计算机技术的迅速发展,新药物的筛选研发也越来越多地和计算机技术相结合。在现有研究中,计算机技术多用于对于实验数据的统计处理,对已有的特征分析归类,更进一步的应用包括计算机辅助药物设计。近年来已经有一些将机器学习应用于提高虚拟筛选效果的研究,诚然虚拟筛选在药物筛选方面有着重要的作用,但虚拟筛选仍依赖于现有的小分子数据库和已经人为分类的各种特征,不足以体现药物的实际应用效果。各个科研机构和实验室,需要一种能应用于实践评判药物效果的药物筛选体系,还需要具有精确率高、抗干扰能力强、时间短、不受制于现有的数据库和人工特征分类,又不受实验室机器人等高成本的制约的优点。综合上述,现有的药物筛选系统不能够满足日益增长的科研需求,因此,建立一种更加简便、高效、精准、低成本的高通量药物筛选体系十分关键。我们考虑将机器学习方法应用到实验室药物筛选系统的建立上。深度学习(DeepLearning)是机器学习中一个分支,其概念源于人工神经网络的研究,能够模仿人脑的机制来观察和解释各种数据,通过组合低层特征形成高层表示属性类别,从而发现数据的分布式特征。深度学习以其训练过程对特征提取的整合,对大型数据的收集和处理和优秀的普适性从而成为近年来人工智能领域的研究热点。中国专利2017101273955公开了基于卷积神经网络的智能化先导化合物发现方法,解决当前先导化合物虚拟筛选效率低、准确度不高的问题,该方法首先将化合物结构式转为平面图片,并进行黑白化与反色处理,所有图片根据化合物的活性属性分类并根据类别分别加以数字标签,输入系统;选取一部分图片作为训练集供卷积神经网络对分类问题进行深度学习,剩余部分作为测试集以评价模型;学习完成后,输入训练集及测试集以外的经同样处理的图片供系统计算,预测其对应的活性属性的概率。然而现有技术中,关于本专利技术基于深度学习的快速精准高通量药物筛选系统,目前还未见报道。
技术实现思路
本专利技术首次利用深度学习方法训练数据,建立了一种基于深度学习的快速精准高通量药物筛选系统,该系统有着极高的准确率和高效、快速、抗干扰等优势,大大缩短了判断药物效果的作用时间,有望替代现有的各种评价药物效果的实验方法。为实现上述目的,本专利技术采取的技术方案是:一种基于深度学习的快速精准高通量药物筛选系统,所述药物筛选系统包括图片预处理模块、神经网络模块,所述图片预处理模块包括通道合并模块、图片标准化模块;通道合并模块的输入数据为细胞单颜色通道图片,通道合并模块将不同的细胞单颜色通道图片合并为多通道图片表示,合并后的图片张量表示为[H,W,C];图片标准化模块承接通道合并模块,其输入数据为合并后的多通道图片张量,图片标准化模块将输入的多通道图片数据标准化为[70,70,C]的张量表示,具体方法如下:(1)使用双立方插值算法将[H,W,C]的图像张量转化为[70,70,C],(2)将经过插值操作的图像张量作正则化操作;神经网络模块承接图片标准化模块,其输入数据为经过标准化的图片张量,经过已经训练完成的神经网络得到最终的预测分类判断。所述预测分类判断如下:作为本专利技术的一个优选实施方案,所述神经网络模块的网络结构如下所示:类型卷积核(数量)尺寸/步长(或注释)卷积(32)3x3/1卷积(64)3x3/1卷积(80)1x1/1卷积(192)3x3/1池化(-)3x3/2模组13x子网络模块1模组25x子网络模块2模组33x子网络模块3池化(-)8x8/1卷积(4)1x1/1Softmax分类输出作为本专利技术的一个优选实施方案,所述子网络模块1的网络结构如下所示:作为本专利技术的一个优选实施方案,所述子网络模块2的网络结构如下所示:作为本专利技术的一个优选实施方案,所述子网络模块3的网络结构如下所示:作为本专利技术的一个优选实施方案,所述神经网络的训练方法如下:采用TensorFlow框架在2块NVIDIAGTX1080Ti显卡上训练神经网络;训练优化器为Adam优化器,相应的训练参数:学习率为0.001,beta1为0.9,beta2为0.999,epsilon为1e-8。本专利技术优点在于:1、现有基于深度学习的药物筛选模型均为虚拟筛药,我们应用实验所得的实践数据集训练模型,可以真实地评估药物作用。2、药物及载药系统作用后在模型中均可得到极高的测试准确率,药物的传递系统并不会影响模型的判断。3、药物作用2小时和6小时,在模型中均可得到很高的测试准确率,而在传统MTT比色法和流式细胞仪分析中都不能实现,大大缩短了判断药物作用的时间。4、药物自身荧光反应对分析结果准确率没有影响,可以克服传统方法误读药物荧光读数导致结果误判的缺点。5、有无抗体染色均可以得到较高的测试准确率,抗体染色可增加其准确率,可根据需求灵活地选择模型构成。6、在模型训练中引入带荧光的药物姜黄素,加强了模型的抗干扰能力。7、用卷积神经网络的思想,应用深度学习建立模型,避免了人为筛选特征带来的评估误差。8、所用数据为细胞图像,设备要求简单易行,构建该系统的成本和测试成本很低。附图说明附图1为神经网络的训练数据示例。其中Ch09和Ch01为白光通道,Ch11为红色荧光染色,Ch02为绿色荧光通道,左图为A549组两种荧光标记抗体染色(Ch11,Ch02),右图HepG2组为一种荧光染色(红色,Ch11)和姜黄素自发绿色荧光(Ch02)干扰。附图2为模型训练测试流程示意图。附图3为模型建立所用数据和测试得到的精确率。其中K表示白光图片数据,R表示红色通道图片数据,G表示绿色通道图片数据。具体实施方式下面结合具体实施方式,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术记载的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。实施例基于深度学习的快速精准高通量药物筛选系统本专利技术运用细胞图像,经过基于卷积神经网络(ConvolutionalNeuralNetwork,CNN)的训练,生成了对于药物作用判断的分类模型“DeepScreen”。该模型在对于药物作用的测试中,展现出本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的快速精准高通量药物筛选系统,其特征在于,所述药物筛选系统包括图片预处理模块、神经网络模块,所述图片预处理模块包括通道合并模块、图片标准化模块;通道合并模块的输入数据为细胞单颜色通道图片,通道合并模块将不同的细胞单颜色通道图片合并为多通道图片表示,合并后的图片张量表示为[H,W,C];图片标准化模块承接通道合并模块,其输入数据为合并后的多通道图片张量,图片标准化模块将输入的多通道图片数据标准化为[70,70,C]的张量表示,具体方法如下:(1)使用双立方插值算法将[H,W,C]的图像张量转化为[70,70,C],(2)将经过插值操作的图像张量作正则化操作;神经网络模块承接图片标准化模块,其输入数据为经过标准化的图片张量,经过已经训练完成的神经网络得到最终的预测分类判断。

【技术特征摘要】
1.一种基于深度学习的快速精准高通量药物筛选系统,其特征在于,所述药物筛选系统包括图片预处理模块、神经网络模块,所述图片预处理模块包括通道合并模块、图片标准化模块;通道合并模块的输入数据为细胞单颜色通道图片,通道合并模块将不同的细胞单颜色通道图片合并为多通道图片表示,合并后的图片张量表示为[H,W,C];图片标准化模块承接通道合并模块,其输入数据为合并后的多通道图片张量,图片标准化模块将输入的多通道图片数据标准化为[70,70,C]的张量表示,具体方法如下:(1)使用双立方插值算法将[H,W,C]的图像张量转化为[70,70,C],(2)将经过插值操作的图像张量作正则化操作;神经网络模块承接图片标准化模块,其输入数据为经过标准化的图片张量,经过已经训练完成的神经网络得到最终的预测分类判断。2.根据权利要求1所述基于深度学习的快速精准高通量药物筛选系统,其特征在于,所述预测...

【专利技术属性】
技术研发人员:程黎明朱融融朱颜菁
申请(专利权)人:上海市同济医院
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1