结构搜索程序、结构搜索设备和结构搜索方法技术

技术编号:32963012 阅读:23 留言:0更新日期:2022-04-09 10:56
本发明专利技术涉及结构搜索程序、结构搜索设备和结构搜索方法。结构搜索程序被配置成搜索其中多个基团链接的化合物的结构,其中计算机执行以下处理:确定包括作为用于使系数值成为预定值的项的约束项的目标函数,所述系数值表示参考三维晶格空间中的多个晶格点中的晶格点之间的距离中的最短距离的基团间距离,基团间距离是布置在第一晶格点处的第一基团与布置在第二晶格点处并且链接至第一基团的第二基团之间的距离;以及通过基于目标函数将多个基团布置在作为多个晶格点的集合的晶格点处,来创建化合物的三维结构。建化合物的三维结构。建化合物的三维结构。

【技术实现步骤摘要】
结构搜索程序、结构搜索设备和结构搜索方法


[0001]本申请涉及结构搜索程序、结构搜索设备和结构搜索方法。

技术介绍

[0002]近年来,在诸如药物发现的场景中,存在一些需要使用计算机来获得具有相对较大尺寸的分子的稳定结构的情况。然而,例如,存在如下一些情况,对于尺寸相对较大的分子例如肽和蛋白质,在考虑到所有原子的暴露的计算中,在实际时间内搜索稳定结构是困难的。
[0003]因此,正在研究通过粗略掌握(粗粒化)分子的结构来缩短计算时间的技术。作为针对粗粒化分子结构的技术,例如,已经研究了以下技术:基于蛋白质中氨基酸残基的一维序列信息将蛋白质粗粒化为线性(连续) 简单立方晶格结构,并且将该蛋白质视为晶格蛋白质。在使用晶格蛋白质的技术中,已经报道了使用量子退火技术来高速搜索稳定结构的技术。
[0004]在使用晶格蛋白质的技术中,例如,使用基于关于要搜索其稳定结构的蛋白质中的氨基酸残基的布置的多个约束的目标函数方程来搜索蛋白质的稳定结构。
[0005]然而,在上述基于多个约束的目标函数方程中,同时满足多个约束有时是困难的,并且可能不能有效地搜索蛋白质的结构。
[0006][引用列表][0007][非专利文献][0008][非专利文献1]R.Babbush等人,"Construction of Energy Functions forLattice Heteropolymers Models:A Case Study in Constraint SatisfactionProgramming and Adiabatic Quantum Optimization",Advance in ChemicalPhysics,155,201

244。

技术实现思路

[0009][技术问题][0010]在一个方面,本实施方式的目的是提供能够有效地搜索其中多个基团链接的化合物的结构的结构搜索程序、结构搜索设备和结构搜索方法。
[0011]在实施方式的一个方面中,公开了一种结构搜索程序,其用于搜索其中多个基团链接的化合物的结构,该程序用于使计算机执行以下处理:基于包括作为用于使系数值成为预定值的项的约束项的目标函数将多个基团布置在作为多个晶格点的集合的三维晶格空间中的晶格点处,所述约束项表示参考三维晶格空间中的多个晶格点中的晶格点之间的距离中的最短距离的基团间距离,基团间距离是多个基团中的第一基团与作为多个基团之一并且链接至第一基团的第二基团之间的距离,第一基团布置在多个晶格点中的第一晶格点处,第二基团布置在多个晶格点中的第二晶格点处;以及通过该布置在三维晶格空间中创建化合物的三维结构。
[0012][专利技术的有益效果][0013]在一个方面,本实施方式可以提供能够有效地搜索其中多个基团链接的化合物的结构的结构搜索程序、结构搜索设备和结构搜索方法。
附图说明
[0014]图1A是示出粗粒化蛋白质并搜索稳定结构的示例的示意图;
[0015]图1B是示出粗粒化蛋白质并搜索稳定结构的示例的示意图;
[0016]图1C是示出粗粒化蛋白质并搜索稳定结构的示例的示意图;
[0017]图2A是用于描述菱形编码方法的示例的示意图;
[0018]图2B是用于描述菱形编码方法的示例的示意图;
[0019]图2C是用于描述菱形编码方法的示例的示意图;
[0020]图2D是用于描述菱形编码方法的示例的示意图;
[0021]图2E是用于描述菱形编码方法的示例的示意图;
[0022]图3是用于描述H
one
的示例的图;
[0023]图4是用于描述H
olap
的示例的图;
[0024]图5是用于描述现有技术中H
conn
的示例的图;
[0025]图6是用于描述H
pair
的示例的图;
[0026]图7是用于描述H
conn
的另一示例的图;
[0027]图8是示出由等式(E)表示的函数的函数值与变量之间的关系的示例的图;
[0028]图9是示出在本实施方式公开的技术的示例中的在函数值与用于使参考最短距离表示的基团间距离的系数值成为预定值的约束项的变量之间的关系的示例的图;
[0029]图10是示出晶格空间中的基团间距离与最短距离之间的关系的示例的图;
[0030]图11是示出本实施方式中公开的结构搜索设备的硬件配置示例的图;
[0031]图12是示出本实施方式中公开的结构搜索设备的另一硬件配置示例的图;
[0032]图13是示出本实施方式中公开的结构搜索设备的功能配置示例的图;
[0033]图14是当使用本实施方式中公开的技术的示例来搜索蛋白质的稳定结构时的流程图的示例;
[0034]图15是示出在具有半径r的每个晶格为S
r
的情况下的示例的图;
[0035]图16A是示出布置有氨基酸残基的晶格点的集合的示例的图;
[0036]图16B是示出布置有氨基酸残基的晶格点的集合的示例的图;
[0037]图16C是示出布置有氨基酸残基的晶格点的集合的示例的图;
[0038]图16D是示出布置有氨基酸残基的晶格点的集合的示例的图;
[0039]图17是示出以三维地示出S1、S2、S3的情况的示例的图;
[0040]图18A是示出将空间信息分配至位X1至X
n
的状态的示例的图;
[0041]图18B是示出将空间信息分配至位X1至X
n
的状态的示例的图;
[0042]图18C是示出将空间信息分配至位X1至X
n
的状态的示例的图;
[0043]图19是用于描述H
one
的示例的图;
[0044]图20是用于描述H
olap
的示例的图;
[0045]图21A是用于描述H
pair
的示例的图;
[0046]图21B是用于描述H
pair
的示例的图;
[0047]图22是示出用于退火方法的退火机的功能配置的示例的图;
[0048]图23是示出转变控制单元的操作流程的示例的图;
[0049]图24A是示出在比较例1中,在将λ
one
、λ
olap
、λ
conn
的参数设置为5 至30之间的为5的整数倍的同一值的情况下,针对低能量侧的七种类型的能量值和位数为“1”的示例的图;
[0050]图24B是示出在比较例1中,在将λ
one
、λ
olap
、λ
conn
的参数设置为5 至30之间的为5的整数倍的同一值的情况下,针对低能量侧的七种类型的能量值和位数为“1”的示例的图;
[0051]图24C是示出在比较例1中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结构搜索程序,其被配置成搜索其中多个基团链接的化合物的结构,在所述结构搜索程序中,计算机执行以下处理:确定包括作为用于使系数值成为预定值的项的约束项的目标函数,所述系数值表示参考三维晶格空间中的多个晶格点中的晶格点之间的距离中的最短距离的基团间距离,所述基团间距离是所述多个基团中布置在所述多个晶格点中的第一晶格点处的第一基团与所述多个基团中布置在所述多个晶格点中的第二晶格点处并且链接至所述第一基团的第二基团之间的距离;以及通过基于所述目标函数将所述多个基团布置在作为所述多个晶格点的集合的所述三维晶格空间中的晶格点处,来在所述三维晶格空间中创建所述化合物的三维结构。2.根据权利要求1所述的结构搜索程序,其中,所述约束项由以下等式(1)表示:H
conn
=∑
n
[∑
i∈a(n),j∈a(n+1)
{abs(b
ij

d0)q
i
q
j
}]
ꢀꢀꢀꢀꢀ
等式(1)其中,在等式(1)中,H
conn
是使所述系数值成为预定值的约束项,a(n)是第n基团中的位数的集合,a(n+1)是第(n+1)基团中的位数的集合,d
ij
是布置在所述多个晶格点中的第i晶格点处的基团与布置在所述多个晶格点中的第j晶格点处的基团之间的基团间距离,d0是所述最短距离,abs(d
ij

d0)是由d
ij
与d0之间的差的绝对值表示的系数值,q
i
是表示布置在所述第i晶格点处的基团的存在或不存在的0或1的二进制变量,以及q
j
是表示布置在所述第j晶格点处的基团的存在或不存在的0或1的二进制变量。3.根据权利要求1所述的结构搜索程序,其中,所述约束项由以下等式(2)表示:H
conn
=∑n[∑
i∈a(n),j∈a(n+1)
{abs{(d
ij
/d0)

1}q
i
q
j
}]
ꢀꢀꢀꢀꢀ
等式(2)其中,在等式(2)中,H
conn
是使所述系数值成为预定值的约束项,a(n)是所述多个基团中的第n基团中的位数的集合,a(n+1)是所述多个基团中的第(n+1)基团中的位数的集合,d
ij
是布置在所述第i晶格点处的基团与布置在所述第j晶格点处的基团之间的基团间距离,d0是所述最短距离,abs{(d
ij
/d0)

1}是由通过从d
ij
与d0的比值减去1获得的数的绝对值表示的系数值,q
i
是表示布置在所述第i晶格点处的基团的存在或不存在的0或1的二进制变量,以及q
j
是表示布置在所述第j晶格点处的基团的存在或不存在的0或1的二进制变量。4.根据权利要求2或3所述的结构搜索程序,其中,所述创建包括通过基于由以下等式(3)表示的目标函数的优化处理来执行创建所述三维结构:H
total
={λ
one
×
H
one

olap
×
H
olap

conn
×
(H
conn
+C)}+H
pair
ꢀꢀꢀꢀ
等式(3)其中,在等式(3)中,H
total
是所述目标函数,H
one
是表示所述多个基团中的每一个的数目为仅一个的约束的约束项,
λ
one
是对H
one
进行加权的参数,H
olap
是表示所述多个基团彼此不交叠的约束的约束项,λ
olap
是对H
olap
进行加权的参数,H
conn
是表示所述多个基团彼此连接的约束,并且是由等式(1)或等式(2)表示的约束项,C是关于所述多个基团彼此连接的约束的常数项,λ
conn
是对H
conn
和C进行加权的参数,以及H
pair
是表示所述多个基团之间的相互作用的项。5.根据权利要求1至4中任一项所述的结构搜索程序,其中,所述创建包括通过基于转换为由以下等式(4)表示的伊辛模型方程的所述目标函数的优化处理来执行创建所述三维结构:其中,在等式(4)中,E是转换为所述伊辛模型方程的目标函数,w
ij
是表示第i位与第j位之间的相互作用的数值,b
i
是表示相对于所述第i位的偏置的数值,x
i
是表示所述第i位为0或1的二进制变量,以及x
j
是表示所述第j位为0或1的二进制变量。6.根据权利要求5所述的结构搜索程序,其中,所述创建包括通过借助于使用退火方法对所述伊辛模型方程执行基态搜索来指定所述伊辛模型方程的最小能量来执行创建所述三维结构。7.根据权利要求1至6中任一项所述的结构搜索程序,其中,所述化合物是蛋白质或肽,并且所述多个基团是氨基酸残基。8.一种结构搜索设备,所述结构搜索设备搜索其中多个基团链接的化合物的结构,所述结构搜索设备包括:创建单元,其被配置成:确定包括作为用于使系数值成为预定值的项的约束项的目标函数,所述系数值表示参考三维晶格空间中的多个晶格点中的晶格点之间的距离中的最短距离的基团间距离,所述基团间距离是所述多个基团中布置在所述多个晶格点中的第一晶格...

【专利技术属性】
技术研发人员:佐藤博之
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1