用于预测化学结构或组合物的至少一个物理化学和/或气味特性值的方法和系统技术方案

技术编号:46370438 阅读:8 留言:0更新日期:2025-09-15 12:47
一种用于预测物理化学和/或气味特性值的方法(100)包括以下步骤:‑定义步骤(105),其定义化学结构或组合物的表示,‑执行步骤(110),其根据所定义的表示来执行端到端训练的集成神经网络或多分支神经网络模型,从而预测物理化学和/或气味特性值,‑提供步骤(115),其提供物理化学和/或气味特性值,该方法还包括:‑提供步骤(120),其向端到端集成神经网络或多分支神经网络装置提供示例数据,包括:‑几个神经网络子装置,其配置为独立预测,‑层,其输出至少一个独立预测的分布值,并且‑所述层包括配置为输出随机值的采样装置,‑操作步骤(125),其操作端到端集成神经网络或多分支神经网络装置,以及‑获得步骤(130),其获得经训练的集成神经网络或多分支神经网络模型。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术旨在提出一个预测化学结构或组合物的至少一个物理化学和/或气味特性值的方法、一个预测化学结构或组合物的至少一个物理化学和/或气味特性值的系统以及一个有效组装化学结构或组合物的方法。尤其适用于风味和香氛行业。


技术介绍

1、在科学实验中,存储在数据库中的测量值305(如图3所示)会因实验环境的不同而变化。通常需要使用理想环境(例如国际空间站)才能获得稳定的条件。即使在近乎完美的环境条件下,技术人员使用的仪器和样品制备也可能略有不同。由于实验变量会根据所用的测量条件而变化,因此合并来自不同来源的实验数据可能很困难。已经开发出用于均质实验数据的统计方法,从而减少这些变量,并取得了中等到良好的效果。在机器学习领域,这种变量可能存在于训练集与测试集之间,也可能存在于已知数据与未来数据之间。

2、机器学习模型的另一个众所周知的问题是模型中超参数的数量,这可能会显著影响模型过拟合训练数据310的能力,如图3所示。可用的数据量可能不足以训练神经网络中所需的超参数数量。因此,最好考虑提取数据有意义的数字数据表示的最低需求。后者可以通过选择参数数量较少的层本文档来自技高网...

【技术保护点】

1.一种用于预测化学结构或组合物的至少一个物理化学和/或气味特性值的方法(100),包括以下步骤:

2.根据权利要求1所述的方法(100),其中,该示例数据的至少一组输入对应于化学结构或组合物中至少一个原子特性的哈希向量,该方法还包括在执行步骤(110)的上游的转换步骤(135),其将所定义的数字化化学结构或组合物转换为表示数字化化学结构或组合物的至少一个原子特性的一组哈希向量,所述一组哈希向量在执行步骤期间用作输入。

3.根据权利要求2所述的方法(100),其中,至少一个原子特性的哈希向量表示以下之一:

4.根据权利要求2或3中任一项所述的方法(10...

【技术特征摘要】
【国外来华专利技术】

1.一种用于预测化学结构或组合物的至少一个物理化学和/或气味特性值的方法(100),包括以下步骤:

2.根据权利要求1所述的方法(100),其中,该示例数据的至少一组输入对应于化学结构或组合物中至少一个原子特性的哈希向量,该方法还包括在执行步骤(110)的上游的转换步骤(135),其将所定义的数字化化学结构或组合物转换为表示数字化化学结构或组合物的至少一个原子特性的一组哈希向量,所述一组哈希向量在执行步骤期间用作输入。

3.根据权利要求2所述的方法(100),其中,至少一个原子特性的哈希向量表示以下之一:

4.根据权利要求2或3中任一项所述的方法(100),其中,键特性的至少一个哈希向量表示以下之一:

5.根据权利要求1至4中任一项所述的方法(100),其中,表示分布的至少一个输出值表示分布的离散度。

6.根据权利要求5所述的方法(100),其中,训练端到端集成神经网络或多分支神经网络装置从而最小化表示分布的离散度的至少一个值。

7.根据权利要求1至6中任一项所述的方法(100),其中,至少一个气味特性表示:

8.根据权利要求1至7中任一项...

【专利技术属性】
技术研发人员:G·高丁R·范德尔森J·赫尔赞F·拉瓦锡
申请(专利权)人:弗门尼舍有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1