信息处理系统、信息处理方法及信息处理程序技术方案

技术编号:34076909 阅读:18 留言:0更新日期:2022-07-11 17:56
一实施方式所涉及的信息处理系统针对多个成分对象获取数值表示及复合比,针对多个参考对象获取数值表示,通过将多个成分对象及多个参考对象各自的数值表示输入到第1机器学习模型,计算多个成分特征矢量及多个参考特征矢量,通过将这些特征矢量输入到第2机器学习模型,针对多个成分对象的每一个计算概率矢量,根据多个概率矢量及多个复合比,针对通过使多个成分对象复合而获得的复合对象,计算复合特征矢量。征矢量。征矢量。

【技术实现步骤摘要】
【国外来华专利技术】信息处理系统、信息处理方法及信息处理程序


[0001]本专利技术的一方式涉及一种信息处理系统、信息处理方法及信息处理程序。

技术介绍

[0002]使用利用机器学习对通过使多个成分对象复合而获得的复合对象进行分析的方法。例如,专利文献1中记载了预测生物高分子的立体结构与化合物的立体结构的键合性的方法。该方法包括:根据生物高分子的立体结构和化合物的立体结构,生成生物高分子与化合物的复合体的预测立体结构的步骤;将该预测立体结构变换为表示与相互作用模式的核对结果的预测立体结构矢量的步骤;及通过使用机器学习算法判断该预测立体结构矢量,预测生物高分子的立体结构与化合物的立体结构的键合性的步骤。
[0003]以往技术文献
[0004]专利文献
[0005]专利文献1:日本特开2019

28879号公报

技术实现思路

[0006]专利技术要解决的技术课题
[0007]在成分对象多样或存在多个的情况下,针对这些成分对象无法准备足够量的数据,其结果,复合对象的分析精度有可能无法达到所期待的水准。因此,期望一种用于即使在针对成分对象无法准备足够量的数据的情况下也提高复合对象的分析精度的结构。
[0008]用于解决技术课题的手段
[0009]本专利技术的一方式所涉及的信息处理系统具备至少一个处理器。至少一个处理器针对多个成分对象的每一个获取数值表示及复合比,针对多个参考对象的每一个获取数值表示,通过将与多个成分对象对应的多个数值表示和与多个参考对象对应的多个数值表示输入到第1机器学习模型,计算该多个成分对象各自的成分特征矢量和该多个参考对象各自的参考特征矢量,通过将多个成分特征矢量及多个参考特征矢量输入到第2机器学习模型,针对该多个成分对象的每一个,计算表示与该多个参考对象的每一个的关联度的概率矢量,根据多个概率矢量及多个复合比,针对通过使多个成分对象复合而获得的复合对象,计算表示与多个参考对象的每一个的关联度的复合特征矢量,输出复合特征矢量。
[0010]在这样的方式中,在考虑复合比之前,使用与各个参考对象的关联度,构成复合对象的各成分对象的特征被明显化。因此,即使在针对成分对象无法准备足够量的数据的情况下,也能够提高复合对象的分析精度。
[0011]专利技术效果
[0012]根据本专利技术的一方式,即使在针对成分对象无法准备足够量的数据的情况下,也能够提高复合对象的分析精度。
附图说明
[0013]图1是表示构成实施方式所涉及的信息处理系统的计算机的硬件结构的一例的图。
[0014]图2是表示实施方式所涉及的信息处理系统的功能结构的一例的图。
[0015]图3是表示实施方式所涉及的信息处理系统的动作的一例的流程图。
[0016]图4是使用数据的具体例对实施方式所涉及的信息处理系统的动作进行说明的图。
具体实施方式
[0017]以下,参考附图,对本专利技术中的实施方式详细地进行说明。另外,在附图说明中,对于相同或等同的要件标注相同的符号,省略重复的说明。
[0018][系统的概要][0019]实施方式所涉及的信息处理系统10是执行与通过以给定的复合比使多个成分对象复合而获得的复合对象有关的分析的计算机系统。成分对象是指用于生成复合对象的有体物或无体物。复合对象可以是有体物或无体物。作为有体物的例子,可举出任意物质或物体。作为无体物的例子,可举出数据及信息。“使多个成分对象复合”是指将多个成分对象作为一个对象,即复合对象的处理。复合的方法没有限定,例如可以是配合、调配、合成、结合、混合、合并、组合、化合、或合体,也可以是其他方法。与复合对象有关的分析是指用于获得表示复合对象的某些特征的数据的处理。
[0020]多个成分对象可以是任意多种材料,在该情况下,复合对象是由这些材料生成的多成分物质。材料是指用于生成多成分物质的任意构成要素。例如,多个材料可以是任意多种分子或原子材料,在该情况下,复合对象是通过以任意方法复合这些分子或原子而获得的多成分物质。例如,材料可以是聚合物,与此相对,多成分物质可以是聚合物合金。材料可以是单体,与此相对,多成分物质可以是聚合物。材料可以是药物,即具有药理作用的化学物质,与此相对,多成分物质可以是药剂。
[0021]信息处理系统10为了与复合对象有关的分析而执行机器学习。机器学习是指通过根据给定的信息进行学习而自主地找出定律或规则的方法。机器学习的具体的方法没有限定。例如,信息处理系统10可以使用作为包含神经网络而构成的计算模型的机器学习模型来执行机器学习。神经网络是指模拟人的脑神经系统的结构的信息处理模型。作为更具体的例子,信息处理系统10也可以使用图神经网络(GNN)、卷积神经网络(CNN)、循环神经网络(RNN)、注意力RNN(Attention RNN)及多头注意力(Multi

Head Attention)中的至少一个来执行机器学习。
[0022][系统的结构][0023]信息处理系统10由1台以上的计算机构成。在使用多台计算机的情况下,这些计算机经由互联网、内部网等通信网络连接,从而逻辑上构建一个信息处理系统10。
[0024]图1是表示构成信息处理系统10的计算机100的一般硬件结构的一例的图。例如,计算机100具备执行操作系统、应用程序等的处理器(例如CPU)101、由ROM及RAM构成的主存储部102、由硬盘、闪存等构成的辅助存储部103、由网卡或无线通信模块构成的通信控制部104、键盘、鼠标等输入装置105、及监视器等输出装置106。
[0025]信息处理系统10的各功能要件通过在处理器101或主存储部102上读入预先设定的程序并使处理器101执行该程序来实现。处理器101按照该程序,使通信控制部104、输入装置105、或输出装置106动作,进行主存储部102或辅助存储部103中的数据的读出及写入。处理所需的数据或数据库存储在主存储部102或辅助存储部103内。
[0026]图2是表示信息处理系统10的功能结构的一例的图。信息处理系统10具备获取部11、第1学习部12、第2学习部13、比率适用部14及预测部15作为功能要件。
[0027]获取部11是获取与多个成分对象有关的数据和与多个参考对象有关的数据的功能要件。参考对象是指与成分对象对应地设定的有体物或无体物,更具体而言,是指属于与成分对象相同的种类或类别的对象。因此,多个参考对象可以是任意多种材料,例如可以是聚合物、单体或药物。
[0028]获取部11针对多个成分对象的每一个获取数值表示及复合比。而且,获取部11针对多个参考对象的每一个获取数值表示。成分对象(或参考对象)的数值表示是指使用多个数值表示成分对象(或参考对象)的任意属性的数据。成分对象(或参考对象)的属性是指成分对象(或参考对象)所具备的性质或特征。在本专利技术中,将成分对象的数值表示称为“成分数值表示”,将参考对象的数值表示称为“参考数值表示”。数值表示可以通过各种方法进行可视化,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信息处理系统,其具备至少一个处理器,所述至少一个处理器针对多个成分对象的每一个获取数值表示及复合比,针对多个参考对象的每一个获取数值表示,通过将与所述多个成分对象对应的多个所述数值表示和与所述多个参考对象对应的多个所述数值表示输入到第1机器学习模型,计算该多个成分对象各自的成分特征矢量和该多个参考对象各自的参考特征矢量,通过将多个所述成分特征矢量及多个所述参考特征矢量输入到第2机器学习模型,针对该多个成分对象的每一个,计算表示与该多个参考对象的每一个的关联度的概率矢量,根据多个所述概率矢量及多个所述复合比,针对通过使所述多个成分对象复合而获得的复合对象,计算表示与所述多个参考对象的每一个的关联度的复合特征矢量,输出所述复合特征矢量。2.根据权利要求1所述的信息处理系统,其中,将所述多个成分对象的个数设为m,将所述多个参考对象的个数设为n,所述多个概率矢量的每一个为n维,将所述多个概率矢量设为Vp1、Vp2、

、Vp
m
,将所述多个复合比设为r1、r2、

、r
m
,将所述复合特征矢量设为Vc,所述至少一个处理器通过下述式(1)计算所述复合特征矢量,Vc=r1×
Vp1+r2×
Vp2+

+r
m
×
Vp
m

(1)。3.根据权利要求1或2所述的信息处理系统,其中,所述至少一个处理器通过将所述复合特征矢量输入到第3机器学习模型,计算所述复合对象的特性的预测值,输出所述预测值。4.根据权利要求1至3中任一项所述的信息处理系统,其中,所述成分对象是材料,所述复...

【专利技术属性】
技术研发人员:花冈恭平
申请(专利权)人:昭和电工材料株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1