一种数据处理方法、装置及系统、图形处理器制造方法及图纸

技术编号:26732484 阅读:23 留言:0更新日期:2020-12-15 14:36
本申请实施例公开了一种数据处理方法、装置及系统、图形处理器,具体的,数据处理方法可以应用于图形处理器,图形处理器可以确定目标化学反应的反应属性,以及多个已知化学反应的反应属性,基于目标化学反应的反应属性和已知化学反应的反应属性,并行计算目标化学反应和已知化学反应的反应相似度,由于图形处理器具有并行处理数据的特性,这样,不同的已知化学反应与目标化学反应的分子相似度的计算可以并行处理,相比于顺序执行而言,可以减少化学反应相似度计算所消耗的时长,提高化学反应相似度的计算效率。

【技术实现步骤摘要】
一种数据处理方法、装置及系统、图形处理器
本专利技术涉及计算机领域,特别是涉及一种数据处理方法、装置及系统、图形处理器。
技术介绍
化学反应之间的相似度是化学信息学中的概念,指两个化学反应的相似程度,化学反应之间的相似度通常考虑化学反应的几个重要因素,例如反应物、产物、反应条件、催化剂、溶剂等,在实际应用中,可以利用反应物的相似程度和产物的相似程度来判断两个化学反应的相似度,例如两个化学反应相似,指两个化学反应的反应物相似,同时两个化学反应的产物也相似。然而,随着化学研究发现的新分子的数量越来越庞大,以及使用计算机构建虚拟分子技术的出现,已知分子数据库中的分子数量逐渐增多,已知化学反应数据库中的数据量也逐渐增多,大概从百万增加到千万,且仍然在不断增长,传统的计算化学反应之间的相似度的计算方法中,耗时非常长,面对较大的数据量时,不能满足实际需求,此外,传统的计算化学反应之间的相似度的计算方式得到的相似度准确性不高。
技术实现思路
为解决上述技术问题,本申请实施例提供一种数据处理方法、装置及系统、图形处理器,从而提高分子相似度计算效率。本申请实施例提供了一种数据处理方法,应用于图形处理器,所述方法包括:获取目标化学反应的反应属性,以及多个已知化学反应的反应属性;基于所述目标化学反应的反应属性和所述已知化学反应的反应属性,并行计算所述目标化学反应和所述已知化学反应的反应相似度。可选的,所述目标化学反应的反应属性根据第一反应中心确定,所述第一反应中心为在所述目标化学反应中发生变化的反应物分子片段和对应的产物分子片段;所述已知化学反应的反应属性根据第二反应中心确定,所述第二反应中心在所述已知化学反应中发生变化的反应物分子片段和对应的产物分子片段。可选的,所述目标化学反应的反应属性包括所述目标化学反应的化学反应指纹序列,所述目标化学反应的化学反应指纹序列通过对所述第一反应中心编码得到;所述已知化学反应的反应属性包括所述已知化学反应的化学反应指纹序列,所述已知化学反应的化学反应指纹序列通过对所述第二反应中心编码得到。可选的,所述目标化学反应的化学反应指纹序列和所述已知化学反应的化学反应指纹序列为以下分子指纹的一种:分子接入系统指纹、摩根指纹、扩展连通性指纹。可选的,所述方法还包括:从多个所述已知化学反应中确定出与所述目标化学反应的反应相似度为最高值的相似反应。本申请实施例还提供了一种数据处理装置,应用于图形处理器,所述装置包括:属性获取单元,用于确定目标化学反应的反应属性,以及多个已知化学反应的反应属性;相似度计算单元,用于基于所述目标化学反应的反应属性和所述已知化学反应的反应属性,并行计算所述目标化学反应和所述已知化学反应的反应相似度。可选的,所述目标化学反应的反应属性根据第一反应中心确定,所述第一反应中心为在所述目标化学反应中发生变化的反应物分子片段和产物分子片段;所述已知化学反应的反应属性根据第二反应中心确定,所述第二反应中心在所述已知化学反应中发生变化的反应物分子片段和产物分子片段。可选的,所述目标化学反应的反应属性包括所述目标化学反应的化学反应指纹序列,所述目标化学反应的化学反应指纹序列通过对所述第一反应中心编码得到;所述已知化学反应的反应属性包括所述已知化学反应的化学反应指纹序列,所述已知化学反应的化学反应指纹序列通过对所述第二反应中心编码得到。可选的,所述目标化学反应的化学反应指纹序列和所述已知化学反应的化学反应指纹序列为以下分子指纹的一种:分子接入系统指纹、摩根指纹、扩展连通性指纹。可选的,所述装置还包括:从多个所述已知化学反应中确定出与所述目标化学反应的反应相似度为最高值的相似反应。本申请实施例还提供了一种图形处理器,包括:处理器、存储器、系统总线;所述处理器以及所述存储器通过所述系统总线相连;所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行所述的数据处理方法。本申请实施例还提供了一种数据处理系统,包括至少一个所述的图形处理器。本申请实施例提供了一种数据处理方法、装置及系统、图形处理器,具体的,数据处理方法可以应用于图形处理器,图形处理器可以确定目标化学反应的反应属性,以及多个已知化学反应的反应属性,基于目标化学反应的反应属性和已知化学反应的反应属性,并行计算目标化学反应和已知化学反应的反应相似度,由于图形处理器具有并行处理数据的特性,这样,不同的已知化学反应与目标化学反应的分子相似度的计算可以并行处理,相比于顺序执行而言,可以减少化学反应相似度计算所消耗的时长,提高化学反应相似度的计算效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种数据处理方法的流程图;图2为本申请实施例提供的一种化学反应中反应物和产物的示意图;图3为本申请实施例提供的一种反应中心的示意图;图4为本申请实施例提供的一种化学反应指纹序列的示意图;图5为本申请实施例提供的一种数据处理装置的结构框图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在实际应用中,可以利用反应物的相似程度和产物的相似程度来判断两个化学反应的相似度,例如两个化学反应相似,指两个化学反应的反应物相似,同时两个化学反应的产物也相似。然而,随着化学研究发现的新分子的数量越来越庞大,以及使用计算机构建虚拟分子技术的出现,已知分子数据库中的分子数量逐渐增多,已知化学反应数据库中的数据量也逐渐增多,大概从百万增加到千万,且仍然在不断增长,传统的计算化学反应之间的相似度的计算方法中,耗时非常长,面对较大的数据量时,不能满足实际需求,此外,传统的计算化学反应之间的相似度的计算方式得到的相似度准确性不高。专利技术人经过研究发现,传统的化学反应相似度计算方法中,耗时长的主要原因是,传统算法依赖于已知化学反应数据库的读取速度和中央处理器(CentralProcessingUnit,CPU)的计算速度,在目前磁盘读取速率和中央处理器性能增长日趋平缓的情势下,仅仅依靠硬件性能升级,计算速度的提升将非常有限,因此不能满足增长速度迅猛的大量的化学反应的相似度计算。而中央处理器不能实现快速的化学反应相似度计算的原因在于,中央处理器的串行特性,使其能够实现数据的串行运算,即中央处理器在一个时间段内只计算一个已知化学反应与本文档来自技高网
...

【技术保护点】
1.一种数据处理方法,其特征在于,应用于图形处理器,所述方法包括:/n获取目标化学反应的反应属性,以及多个已知化学反应的反应属性;/n基于所述目标化学反应的反应属性和所述已知化学反应的反应属性,并行计算所述目标化学反应和所述已知化学反应的反应相似度。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于图形处理器,所述方法包括:
获取目标化学反应的反应属性,以及多个已知化学反应的反应属性;
基于所述目标化学反应的反应属性和所述已知化学反应的反应属性,并行计算所述目标化学反应和所述已知化学反应的反应相似度。


2.根据权利要求1所述的方法,其特征在于,所述目标化学反应的反应属性根据第一反应中心确定,所述第一反应中心为在所述目标化学反应中发生变化的反应物分子片段和对应的产物分子片段;所述已知化学反应的反应属性根据第二反应中心确定,所述第二反应中心在所述已知化学反应中发生变化的反应物分子片段和对应的产物分子片段。


3.根据权利要求2所述的方法,其特征在于,所述目标化学反应的反应属性包括所述目标化学反应的化学反应指纹序列,所述目标化学反应的化学反应指纹序列通过对所述第一反应中心编码得到;所述已知化学反应的反应属性包括所述已知化学反应的化学反应指纹序列,所述已知化学反应的化学反应指纹序列通过对所述第二反应中心编码得到。


4.根据权利要求3所述的方法,其特征在于,所述目标化学反应的化学反应指纹序列和所述已知化学反应的化学反应指纹序列为以下分子指纹的一种:分子接入系统指纹、摩根指纹、扩展连通性指纹。


5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:
从多个所述已知化学反应中确定出与所述目标化学反应的反应相似度为最高值的相似反应。


6.一种...

【专利技术属性】
技术研发人员:夏宁万钦
申请(专利权)人:武汉智化科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1