【技术实现步骤摘要】
预配训练数据使神经网络识别NMR测量中信号的系统和方法
本专利技术大体涉及在NMR频谱法中的信号检测,且更确切地说,涉及用于神经网络的训练数据的产生以使所述神经网络能够识别从现实NMR频谱法实验获得的频谱中的信号间隔。
技术介绍
核磁共振(NMR)频谱法是观测在原子级别的分子性质的频谱技术。当将样本放置在磁场中时,在原子核周围诱发局部磁场。可通过将射频(RF)脉冲施加到样本且监视为NMR信号的响应来观测这些诱发的场。所述NMR信号由敏感性RF接收器拾取。局部诱发的场具体针对原子核的分子环境,因此给出对分子和其个别官能团的电子结构的细节的接取。举例来说,NMR频谱法用来识别有机化合物、蛋白质和其它复杂分子。除了识别外,NMR频谱法还提供关于分子的结构、动态、反应状态和化学环境的详细信息。普通类型的NMR是质子和碳-13NMR频谱法,但它适用于含有具有大于零的核磁矩的核自旋的任何种类的样本。在所述文件中,产生NMR信号的分子被称作NMR活性分子或NMR活性物质。在通过射频(典型地,60MHz到1000MHz)脉冲激励样本后,获得核磁共振响应,这被称作自由感应衰减(FID)。FID是非常弱的信号,且需要敏感性RF接收器来拾取。可应用傅立叶变换来从原始时域FID提取频域频谱。来自信号FID的频谱典型地具有低信噪比,因此通常需要多个FID,且将其平均化以便获得具有较好信噪比的频谱。对激励的响应的衰减时间(典型地,按秒来测量)取决于张弛的有效性,它对于较轻原子核和在固体中较快,且对于较重原子核和在溶液中较慢,然而其在气体 ...
【技术保护点】
1.一种用于产生训练数据集(141)以用于训练神经网络(230)供在NMR频谱中的信号分析的计算机实施方法(1000),包括:/n获得(1100)多个计算的NMR原始频谱(213),每一原始频谱与具有已知数目个质子(#P)的不同NMR活性分子(211)相关联;/n通过每一原始频谱(213)与一个或多个谱线成形函数的卷积来变宽(1200)所述原始频谱的谱线宽度以产生变宽的频谱(111),作为用于每一原始频谱的当前频谱,其中谱线宽度的所述变宽遵循在所述多个当前频谱上的统计分布,这是通过从所述统计分布针对所述各种原始频谱取样相应变宽值;/n针对每一加宽的频谱(111)计算(1310)其积分函数以计数与所述相应加宽的频谱的峰相关联的质子的所述数目;/n将信号间隔识别(1320)为所述加宽的频谱(111)中的间隔,其中所述积分函数大致按与单个质子相关联的所述值的倍数增大,使得计数的质子的总数匹配所述相关联的分子的所述已知质子数(#P),其中调整所述识别的间隔(211)以至少涵盖对应的峰间隔的预定阈值;/n将具有针对所述识别的信号间隔的相关联的标签(121)的所述当前频谱(111、111')作为所 ...
【技术特征摘要】
20191220 EP 19218443.01.一种用于产生训练数据集(141)以用于训练神经网络(230)供在NMR频谱中的信号分析的计算机实施方法(1000),包括:
获得(1100)多个计算的NMR原始频谱(213),每一原始频谱与具有已知数目个质子(#P)的不同NMR活性分子(211)相关联;
通过每一原始频谱(213)与一个或多个谱线成形函数的卷积来变宽(1200)所述原始频谱的谱线宽度以产生变宽的频谱(111),作为用于每一原始频谱的当前频谱,其中谱线宽度的所述变宽遵循在所述多个当前频谱上的统计分布,这是通过从所述统计分布针对所述各种原始频谱取样相应变宽值;
针对每一加宽的频谱(111)计算(1310)其积分函数以计数与所述相应加宽的频谱的峰相关联的质子的所述数目;
将信号间隔识别(1320)为所述加宽的频谱(111)中的间隔,其中所述积分函数大致按与单个质子相关联的所述值的倍数增大,使得计数的质子的总数匹配所述相关联的分子的所述已知质子数(#P),其中调整所述识别的间隔(211)以至少涵盖对应的峰间隔的预定阈值;
将具有针对所述识别的信号间隔的相关联的标签(121)的所述当前频谱(111、111')作为所述训练数据集(141)提供(1500)到所述神经网络。
2.根据权利要求1所述的方法,其中所述相关联的NMR活性分子的分子量小于或等于500道尔顿。
3.根据权利要求1或2所述的方法,进一步包括:
在已接收到所述多个计算的NMR原始频谱后,预处理(1150)所述接收的原始频谱,使得在每一原始频谱中的数据点的数目大致对应于从现实NMR实验获得的相当的现实NMR频谱的数据点的数目。
4.根据权利要求1到3中任一项所述的方法,其中所述一个或多个谱线成形函数选自由以下各者组成的群组:洛伦兹函数、高斯函数和福格特函数。
5.根据权利要求1到4中任一项所述的方法,其中用于变宽的所述统计分布选自由以下各者组成的群组:伽玛分布、贝塔分布、对数正态分布。
6.根据权利要求5所述的方法,其中谱线变宽值等效于从0.3Hz到0.6Hz的范围。
7.根据前述权利要求中任一项所述的方法,进一步包括:
在已识别所述信号间隔后,将一个或多个统计修改应用(1400)于每一当前频谱,其中特定统计修改的统计参数在统计上分布于所述多个当前频谱上。
8.根据前述权利要求中任一项所述的方法,进一步包括:
在已识别所述信号间隔后,将杂质的效应添加(1410)到所述当前频谱(111),其中杂质的数目、对应的位移和振幅在...
【专利技术属性】
技术研发人员:克莉丝汀·博利格尔,奥利弗·霍拉赫尔,约亨·克拉格斯,伊琳娜·加利亚什,马可·格鲁尔,法布里斯·莫里奥,
申请(专利权)人:布鲁克瑞士股份公司,
类型:发明
国别省市:瑞士;CH
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。