特征量计算方法、特征量计算程序、特征量计算装置、筛选方法、筛选程序及化合物创建方法制造方法及图纸

技术编号:31013699 阅读:19 留言:0更新日期:2021-11-30 02:16
本发明专利技术的目的在于,提供一种能够计算出准确表示对象结构体的化学性质的特征量的方法、程序及装置。并且,本发明专利技术的目的在于,提供一种能够使用特征量来有效进行医药候选化合物的筛选的方法及程序。并且,本发明专利技术的目的在于,提供一种能够使用特征量来有效创建医药候选化合物的立体结构的方法。在对象结构体彼此之间探针的聚集程度相似是表示这些对象结构体的化学性质相似。即,通过第1方式计算出的特征量相似的对象结构体显示出相似的化学性质。因此,通过第1方式,能够计算出准确表示对象结构体的化学性质的特征量。体的化学性质的特征量。体的化学性质的特征量。

【技术实现步骤摘要】
【国外来华专利技术】特征量计算方法、特征量计算程序、特征量计算装置、筛选方法、筛选程序及化合物创建方法


[0001]本专利技术涉及一种进行特征量的计算、化合物的筛选及化合物的立体结构的创建的方法、程序及装置,尤其涉及一种搜索医药候选化合物的技术。

技术介绍

[0002]以往,使用了计算机的药物研发中,通过准备收集数万到十万左右的现有的化合物而成的库且提供化合物的结构式来调查相对于1个目标蛋白质的键合力,搜索医药候选化合物(以下,称为“命中(hit)”)。例如,在下述专利文献1中,提供化合物的结构式来预测键合力。并且,在专利文献2中,也记载有反复进行结构式的生成和键合力的预测来逐渐搜索具有所期望的键合力的化合物(反复试验)。
[0003]并且,在专利文献3中,记载有使用被称为“化合物指纹(指纹识别)”的描述符来进行搜索。“描述符”是指由化合物的结构式获得的信息,“化合物指纹”表示各种官能团的有无等信息。这种描述符的特征在于“若化合物的描述符相似,则化合物的骨架相似”。
[0004]以往技术文献
[0005]专利文献
[0006]专利文献1:美国专利第9373059号公报
[0007]专利文献2:日本专利第5946045号公报
[0008]专利文献3:日本专利第4564097号公报

技术实现思路

[0009]专利技术要解决的技术课题
[0010]近年来,需求高的目标蛋白质变得较复杂且高难度,仅通过库的筛选难以发现命中。另一方面,化合物的理论上的数量即使限制在分子量500以下的低分子也有(10的60次方)个,当扩大至分子量1,000左右的中分子时,其数量进一步增加,若考虑有史以来所合成的化合物为(10的9次方)个左右,则仍然有可能发现命中。但是,针对这种天文数字量的化合物整体调查键合力,不仅在实验中,即使在模拟中也几乎无法进行。即使在对于一部分的化合物调查键合力的情况下,如上所述专利文献1、2那样反复进行反复试验时效率也低。并且,在如专利文献3中所记载的指纹(Fingerprint)那样的现有的描述符(特征量)的情况下,即使为显示出相同药效的化合物,其特征量也并不一定相似,特征量未准确表示对象结构体的化学性质,因此使用了特征量的搜索的效率低。
[0011]如此,在现有的技术中,特征量未准确表示对象结构体的化学性质,因此使用了特征量的筛选及立体结构创建的效率低。
[0012]本专利技术是鉴于这种情况而完成的,其目的在于,提供一种能够计算出准确表示对象结构体的化学性质的特征量的特征量计算方法、特征量计算程序及特征量计算装置。并且,本专利技术的目的在于,提供一种能够使用特征量来有效进行医药候选化合物的筛选的筛
选方法及筛选程序。并且,本专利技术的目的在于,提供一种能够使用特征量来有效创建医药候选化合物的立体结构的化合物创建方法。
[0013]用于解决技术课题的手段
[0014]为了达到上述目的,本专利技术的第1方式所涉及的特征量计算方法具有:对象结构体指定工序,指定由具有化学性质的多个单元结构体构成的对象结构体;及特征量计算工序,计算出在三维空间中对对象结构体的立体结构的周围的1种类以上的探针的聚集程度进行定量化而获得的特征量,并且使用通过机器学习构成的生成器由对象结构体计算出特征量,探针为具有实数电荷且产生范德华力的多个点分开配置而成的结构体。
[0015]对象结构体的化学性质被表示为对象结构体与其周围的1种类以上的探针之间的相互作用的结果,因此在对象结构体彼此之间探针的聚集程度相似是表示这些对象结构体的化学性质相似的情况。即,通过第1方式计算出的特征量相似的对象结构体显示出相似的化学性质。因此,通过第1方式,能够计算出准确表示对象结构体的化学性质的特征量。
[0016]在第1方式中,用于特征量的计算中的“生成器”(预测模型、已学习模型)例如能够通过“具有将『将针对多个化合物的、表示化合物的立体结构的信息(三维图像等)设为教师数据且将特征量设为解释变量的学习用数据集』输入至生成器并通过机器学习进行学习的学习处理工序的生成器的构建方法”来构建。可以使用分层神经网络构建生成器。
[0017]在第1方式中,构成探针的“点”与数学“点”不同而可以具有大小(实际的原子、离子等)。并且,可以将虚拟的点电荷(“点”的一方式)或偶极子等作为探针而不是实际的原子等。探针能够按照成为目标(对象结构体)的化合物进行选择。
[0018]另外,第1方式所涉及的特征量计算方法能够通过计算机或具备这种计算机的特征量计算装置、特征量计算系统等来执行,所述计算机使用1个以上的CPU(Central Processing Unit:中央处理器)等各种处理器来实现。对以下各方式所涉及的特征量计算方法、筛选方法及化合物创建方法也相同。
[0019]第2方式所涉及的特征量计算方法在第1方式中,在对象结构体指定工序中,指定化合物作为对象结构体,在特征量计算工序中,使用生成器计算出在三维空间中对化合物的立体结构的周围的、作为探针的氨基酸的聚集程度进行定量化而获得的特征量即第1特征量。在第2方式中,将第1方式中的“探针”设为氨基酸,将第1方式中的“对象结构体”设为化合物,将第1方式中的“多个单元结构体”设为多个原子。对聚集程度进行定量化的氨基酸并不限于1种类,可以为键合有2种类以上的氨基酸的肽。
[0020]与第1方式相同地,从局部来看,化合物的药效(例如,对于目标蛋白质的键合力)被表示为化合物与各氨基酸(探针的一方式)之间的相互作用的结果,因此只要在化合物之间氨基酸的聚集程度为相似,则表示这些化合物(与目标蛋白质的)键合力相似。即,第2方式所涉及的特征量(第1特征量)相似的化合物显示出相似的药效。因此,能够通过第2方式计算出准确表示化合物的化学性质的特征量。另外,在第2方式中,能够指定生物配体等已知对于立体结构及目标蛋白质的键合的化合物作为对象结构体。
[0021]第3方式所涉及的特征量计算方法在第1方式中,在对象结构体指定工序中,指定与目标蛋白质的活性部位即口袋键合的口袋结构体作为对象结构体,在特征量计算工序中,使用生成器计算出在三维空间中对基于多个虚拟球体的口袋结构体的立体结构的周围的、作为探针的氨基酸的聚集程度进行定量化而获得的特征量即第2特征量。在第3方式中,
将第1方式中的“探针”设为氨基酸,将第1方式中的“对象结构体”设为口袋结构体,将第1方式中的“单元结构体”设为多个虚拟球体。目标蛋白质的“活性部位”是指通过口袋结构体键合而促进或抑制目标蛋白质的活性的部位,能够认为“虚拟球体”具有范德华半径、电荷等化学性质。
[0022]与第2方式的上述内容相同地,第3方式所涉及的特征量(第2特征量)相似的口袋结构体显示出相似的化学性质,因此能够通过第3方式计算出准确表示口袋结构体的化学性质的特征量。另外,口袋结构体对应于与目标蛋白质的口袋键合的化合物。并且,在第3方式中,能够将基于目标蛋白质的立体结构的实际测量结果、口袋的位置信息等的模拟用于第2特征量的计算中。另外本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种特征量计算方法,其具有:对象结构体指定工序,指定由具有化学性质的多个单元结构体构成的对象结构体;及特征量计算工序,计算出在三维空间中对所述对象结构体的立体结构的周围的1种类以上的探针的聚集程度进行定量化而获得的特征量,并且使用通过机器学习构成的生成器由所述对象结构体计算出所述特征量,所述探针为具有实数电荷且产生范德华力的多个点分开配置而成的结构体。2.根据权利要求1所述的特征量计算方法,其中,在所述对象结构体指定工序中,指定化合物作为所述对象结构体,在所述特征量计算工序中,使用所述生成器计算出在所述三维空间中对所述化合物的所述立体结构的周围的、作为所述探针的氨基酸的聚集程度进行定量化而获得的特征量即第1特征量。3.根据权利要求1所述的特征量计算方法,其中,在所述对象结构体指定工序中,指定与目标蛋白质的活性部位即口袋键合的口袋结构体作为所述对象结构体,在所述特征量计算工序中,使用所述生成器计算出在所述三维空间中对基于多个虚拟球体的所述口袋结构体的立体结构的周围的、作为所述探针的氨基酸的聚集程度进行定量化而获得的特征量即第2特征量。4.根据权利要求1所述的特征量计算方法,其中,在所述对象结构体指定工序中,指定化合物作为所述对象结构体,在所述特征量计算工序中,使用所述生成器计算出在所述三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第3特征量,所述聚集程度为所述化合物的所述立体结构的周围的所述探针的聚集程度,且将1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及由多个原子构成的1种类以上的离子中的1个以上作为所述探针。5.一种特征量计算程序,其使计算机执行权利要求1至4中任一项所述的特征量计算方法。6.一种记录介质,其为非临时且计算机能够读取的记录介质,在存储于所述记录介质中的指令被计算机读取的情况下,使计算机执行权利要求5所述的特征量计算程序。7.一种特征量计算装置,其具备:对象结构体指定部,指定由具有化学性质的多个单元结构体构成的对象结构体;及特征量计算部,计算出在三维空间中对所述对象结构体的立体结构的周围的1种类以上的探针的聚集程度进行定量化而获得的特征量,并且使用通过机器学习构成的生成器由所述对象结构体计算出所述特征量,所述探针为具有实数电荷且产生范德华力的多个点分开配置而成的结构体。8.一种筛选方法,其从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求2所述的特征量计算方法针对所述化合物的所述立体结构计算出的所述第1特征量建立关联并进行存储;
特征量计算工序,针对确认到与所述目标蛋白质的键合的化合物即配体,使用权利要求2所述的特征量计算方法计算出所述第1特征量;相似度计算工序,计算出针对所述多个化合物的所述第1特征量与针对所述配体的所述第1特征量的相似度;及化合物提取工序,根据所述相似度从所述多个化合物中提取所述目标化合物。9.一种筛选方法,其从多个化合物中提取与目标蛋白质键合的目标化合物,所述筛选方法具有:存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求2所述的特征量计算方法计算出的所述第1特征量建立关联并进行存储;特征量计算工序,针对所述目标蛋白质的所述口袋结构体,使用权利要求3所述的特征量计算方法计算出所述第2特征量;相似度计算工序,计算出针对所述多个化合物的所述第1特征量与针对所述口袋结构体的所述第2特征量的相似度;及化合物提取工序,根据所述相似度从所述多个化合物中提取所述目标化合物。10.一种筛选方法,其从多个化合物中提取与除了蛋白质以外的目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求4所述的特征量计算方法针对所述化合物的所述立体结构计算出的所述第3特征量建立关联并进行存储;特征量计算工序,针对确认到与除了所述蛋白质以外的所述目标生物高分子键合的化合物即键合化合物,使用权利要求4所述的特征量计算方法计算出所述第3特征量;相似度计算工序,计算出针对所述多个化合物的所述第3特征量与针对所述键合化合物的所述第3特征量的相似度;及化合物提取工序,根据所述相似度从所述多个化合物中提取所述目标化合物。11.一种筛选方法,其具...

【专利技术属性】
技术研发人员:津村享佑中林淳大平诗野
申请(专利权)人:富士胶片株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1