System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于遗传算法的高通量核磁数据处理方法、装置及可读介质制造方法及图纸_技高网
当前位置: 首页 > 专利查询>厦门大学专利>正文

基于遗传算法的高通量核磁数据处理方法、装置及可读介质制造方法及图纸

技术编号:40433630 阅读:4 留言:0更新日期:2024-02-22 22:59
本发明专利技术公开了一种基于遗传算法的高通量核磁数据处理方法、装置及可读介质,该方法包括:获取一组反应物在反应过程中的不同时间点采集到的若干核磁谱,对若干核磁谱分别进行基线校正、相位校正、寻找谱峰,并以Gaussian软件计算得到的化学位移为依据,分别确定一组反应物及其中间产物和最终产物在对应的核磁谱中的积分范围;并计算得到对应的谱峰在采样时间点的积分值,将积分值转换为一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值;根据一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值采用遗传算法结合贝叶斯算法确定一组反应物在反应过程中最优的平衡常数,该方法处理速度快,兼容性强。

【技术实现步骤摘要】

本专利技术涉及核磁数据处理领域,具体涉及一种基于遗传算法的高通量核磁数据处理方法、装置及可读介质


技术介绍

1、在过去的十几年里,高通量自动化合成受益于机器学习、人工智能和自动化设备的进步得到飞速发展,高通量自动化合成具有简便、快速、低成本和高效率的特点。使研究人员能够更快速地合成和测试新的化合物。这对于药物合成、材料发现和化学生物学等领域非常重要,其中核磁谱是目前用于确定化合物成分的主流方法之一,通过分析核磁谱,可以确定复杂化学反应的产率等信息。

2、随着科研人员对核磁共振(nmr)自动化需求程度越来越高。大多数现代nmr谱仪都配备了自动调谐/自动匹配探头以及自动锁场系统。虽然硬件自动化已经发展的比较成熟,但基于nmr的高通量自动化软件系统一直存在瓶颈,人工分析和指认所收集的nmr图谱所需时间非常长。

3、目前主流的处理核磁谱的软件都是商业软件,需要购买许可证才能使用完整的功能,如mestrenova、topspin、inmr和nmrpipe等,但是大部分情况下,科研人员都只使用了基线校正、相位调整和积分等简单的操作,此外这些商业软件处理谱图时每次只能处理一张谱图,并不能自动进行多次且重复的操作。

4、现有技术中所提到的如mnova nmr lite(ong,t.mnova lite for nmr dataanalysis:a free,personalized way to analyze and manage your nmr data.manage1–12(2011).)、sparky(lee w,tonelli m,markley jl.nmrfam-sparky:enhancedsoftware for biomolecular nmr spectroscopy.bioinformatics.2015apr 15;31(8):1325-7)等都具有其局限性,mnova nmr lite只支持bruker格式的核磁谱,sparky适用于生物分子的nmr数据,对于有机化学分子还需要额外的格式转换,具有一定的学习门槛。以上方法都不能够进行高通量的数据处理,此外像inmr不支持linux系统。

5、因此,非常有必要开发一种同时支持windows、macos、linux系统,能够高通量处理核磁共振数据的方法。


技术实现思路

1、针对上述提到的技术问题。本申请的实施例的目的在于提出了一种基于遗传算法的高通量核磁数据处理方法、装置及可读介质,来解决以上
技术介绍
部分提到的技术问题。

2、第一方面,本专利技术提供了一种基于遗传算法的高通量核磁数据处理方法,包括以下步骤:

3、获取一组反应物在反应过程中的不同时间点采集到的若干核磁谱,对若干核磁谱分别进行基线校正、相位校正、寻找谱峰,并以gaussian软件计算得到的化学位移为依据,分别确定一组反应物及其中间产物和最终产物在对应的核磁谱中的积分范围;

4、根据一组反应物及其中间产物和最终产物在对应的核磁谱中的积分范围计算得到一组反应物及其中间产物和最终产物对应的谱峰在采样时间点的积分值,将积分值转换为一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值;

5、根据一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值采用遗传算法结合贝叶斯算法确定一组反应物在反应过程中最优的平衡常数。

6、作为优选,寻找谱峰,具体包括:

7、选择化学位移范围,在化学位移范围内采用寻峰算法确定谱峰点;

8、寻峰算法的步骤如下:

9、判断经过基线校正和相位校正后的核磁谱中的任一数据点是否大于所有数据点的均方误差的3倍,若是,则将该数据点作为待确认的谱峰点;

10、对经过基线校正和相位校正后的核磁谱中的每个数据点求离散一阶导数,公式如下:

11、

12、其中,dk是第k个数据点的一阶导数,si是以第k点为中心周围第i个的数据点,负号表示右边,正号表示左边,i=1,2,…,5;

13、判断任一待确认的谱峰点的一阶导数是否大于所有数据点的一阶导数的均方误差的3倍,若是,则将待确认的谱峰点确定为谱峰点,剩余的数据点则为基线点。

14、作为优选,gaussian软件计算得到的化学位移的具体计算过程如下:

15、使用chemdraw绘制反应物与中间产物和最终产物的化学结构并保存为mol格式文件,然后将mol格式文件作为gaussian软件的输入,在b3lyp/6-31+g(d,p)水平下进行结构优化,在b3lyp/6-311+g(2d,p)水平下进行nmr计算,并结合经验修正参数slope=-1.0676、intercept=31.9156,得到反应物及其中间产物和最终产物中h原子的化学位移。

16、作为优选,根据一组反应物及其中间产物和最终产物在对应的核磁谱中的积分范围计算得到一组反应物及其中间产物和最终产物对应的谱峰在采样时间点的积分值,具体包括:

17、将核磁谱中的数据点进行插值操作,并将一组反应物及其中间产物和最终产物在对应的核磁谱中的积分范围内的相邻两个插值后的数据点之间的积分面积,并将积分范围内的所有积分面积相加,得到一组反应物及其中间产物和最终产物对应的谱峰在采样时间点的积分值。

18、作为优选,将积分值转换为一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值,具体包括:

19、将一组反应物及其中间产物和最终产物对应的谱峰在采样时间点的积分值归一化再乘以一组反应物的初始浓度之和,得到一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值。

20、作为优选,根据一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值采用遗传算法结合贝叶斯算法确定一组反应物在反应过程中的平衡常数,具体包括:

21、采用广度遗传算法随机给出m组平衡常数的取值范围,并作为初始染色体上的基因,种群为m个染色体;

22、将染色体经过交叉变异操作后,共有2m个染色体;

23、将每个染色体所对应的平衡常数的取值范围输入贝叶斯算法进行n次迭代,在每次迭代过程中,在每个染色体所对应的平衡常数的取值范围内随机采样出k组平衡常数k的精确值,根据每一组平衡常数k的精确值计算得到一组反应物及其中间产物和最终产物在每个采样时间的浓度的预测值,并将对应采样时间的浓度的预测值与浓度的真实值之间的均方误差作为贝叶斯算法的损失函数;

24、将k组平衡常数k的精确值及其对应的浓度的预测值与浓度的真实值之间的均方误差作为高斯过程模型的输入和输出并拟合出一个高斯过程模型,每次迭代后对高斯过程模型进行更新,在更新后的高斯过程模型中选择损失函数最小所对应的平衡常数k的精确值;

25、2m个染色体经过贝叶斯算法进行迭代后,得到2m个平衡常数k的精确值及其对应的置信度;

26、响应于本文档来自技高网...

【技术保护点】

1.一种基于遗传算法的高通量核磁数据处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述寻找谱峰,具体包括:

3.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述Gaussian软件计算得到的化学位移的具体计算过程如下:

4.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述根据所述一组反应物及其中间产物和最终产物在对应的核磁谱中的积分范围计算得到所述一组反应物及其中间产物和最终产物对应的谱峰在采样时间点的积分值,具体包括:

5.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述将所述积分值转换为所述一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值,具体包括:

6.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述根据所述一组反应物及其中间产物和最终产物在每个采样时间的浓度的真实值采用遗传算法结合贝叶斯算法确定所述一组反应物在反应过程中的平衡常数,具体包括:

7.根据权利要求6所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述第二阈值大于第一阈值。

8.一种基于遗传算法的高通量核磁数据处理装置,其特征在于,包括:

9.一种电子设备,包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。

...

【技术特征摘要】

1.一种基于遗传算法的高通量核磁数据处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述寻找谱峰,具体包括:

3.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述gaussian软件计算得到的化学位移的具体计算过程如下:

4.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述根据所述一组反应物及其中间产物和最终产物在对应的核磁谱中的积分范围计算得到所述一组反应物及其中间产物和最终产物对应的谱峰在采样时间点的积分值,具体包括:

5.根据权利要求1所述的基于遗传算法的高通量核磁数据处理方法,其特征在于,所述将所述积分值转...

【专利技术属性】
技术研发人员:王忻昌樊鑫
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1