一种基于机器学习的致肥胖化学品预测方法及装置制造方法及图纸

技术编号：39574415 阅读：14 留言：0更新日期：2023-12-03 19:26

本发明专利技术公开了一种基于机器学习的致肥胖化学品预测方法，所述致肥胖化学品是指能促进

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的致肥胖化学品预测方法及装置

[0001]本专利技术属于化合物预测
，尤其涉及一种基于机器学习的致肥胖化学品预测方法及装置
。

技术介绍

[0002]统计数据显示世界肥胖和超重人口从
1980
年的8亿多增加到
2013
年的
21
亿，近年来仍在持续增加
。
肥胖会增加患2型糖尿病
、
心血管疾病和癌症的风险，目前已成为一项重大的全球健康挑战
。
值得注意的一点是，肥胖的流行与化学品的广泛使用同时发生
。
越来越多的研究表明环境污染物会导致肥胖，这些能干扰人体脂质代谢稳态以促进脂肪形成和脂质积累的化学物质称为致肥胖化学品，目前仍缺少相应监管政策
。
[0003]目前毒理学公认的致肥胖化学品判定指标为：能促进
3T3
‑
L1
细胞的成脂分化过程
。
现有机制学研究发现，与过氧化物酶体增殖物激活受体
(peroxisome proliferator activated receptor gamma,PPAR
γ
)、
糖皮质激素受体
(glucocorticoid receptor,GR)、
肝脏
X
受体
(liver X receptor,LXR)、
视黄酸受体
(retinoic acid receptor
，r/>RXR)、CCAAT/
增强子结合蛋白
(CCAAT/enhancer binding protein beta
，
C_EBP)、
固醇调节元件结合转录因子
(sterol regulatory element binding transcription factor 1
，
SREBP)
相互作用是促进
3T3
‑
L1
细胞的成脂分化过程的关键分子机制
。
[0004]根据上述关键分子机制提出了两种化学品致肥胖潜力打分方法：5‑
slice
和8‑
slice
方法
。
这两种方法基于美国环保署
ToxCast
计划中批量体外试验获得的化合物与上述六个受体及蛋白的相互作用数据，5‑
slice
方法将数据划分为5部分
(PPAR
γ
，
GR
，
LXR
，
RXR
，
Other)
，每部分内数据计算平均值，各部分相加得出总分，8‑
slice
方法将数据划分为8部分
(PPRE
，
PPAR
γ
，
GR
，
LXR
，
LXRE
，
RXR
，
C_EBP
，
SREBP)
，每部分内数据计算平均值，各部分相加得出总分，得分高的化学品具有较高的致肥胖潜力
。
上述方法局限性主要是依赖体外试验的数据，而体外试验测试成本高昂，实验周期久，不能快速
、
批量预测致肥胖化学品
。
每年大量化学物质进入环境介质，新化合物的申报及环境风险评估与管控领域需要判别化学物质对人体健康的慢性毒害作用，因此，当前亟需开发一种可以批量
、
快速
、
精准预测致肥胖化学品的技术方法，通过该种方法筛选出致肥胖化学品，服务于新化合物的环境风险评估与管控
。
[0005]专利文献
CN114171137A
公开了一种基于机器学习预测化合物环境危害性的方法，包括以下步骤：
(1)
建立化合物环境危害性筛选标准；
(2)
采集样本标签和样本数据，对样本数据进行预处理；
(3)
基于机器学习算法构建预测模型，利用预处理后的样本数据优化预测模型参数；
(4)
预测待测化合物是否具有环境危害性
。
该方法采用化学特性和急性毒性对输入的物质进行预测，并仅针对均符合要求的物质标定为危害物质，但是该方法存在漏检的问题，即实际危害物质仅满足其中一个或两个条件而被标定非危害物质
。
同时该方法不能识别化学品的毒性作用机制
。
[0006]专利文献
CN109360610A
公开了一种基于模糊神经网络的化学分子生物毒性预测
模型算法，以不同化学结构的疏水性为控制量，生物毒性量为被控量，包括以下步骤：
(1)
建立生物毒性与辛醇
/
水分配系数的
QSAR
模型，即建立用于化学分子合成过程中生物毒性与辛醇
/
水分配系数的模型；
(2)
建立模糊神经网络化学分子毒性预测模型；
(3)
建立优化
NFN
参数的遗传算法模型用于修正模糊神经网络参数；
(4)
最后利用优化后的模糊神经网络模型对新分子的生物毒性值进行计算预测
。

技术实现思路

[0007]本专利技术的目的是提供一种基于机器学习的致肥胖化学品预测方法及装置，该方法无需依赖体外试验数据，对致肥胖化学品进行预测
。
[0008]为了实现本专利技术的第一个目的，提供了一种基于机器学习的致肥胖化学品预测方法，所述致肥胖化学品是指能促进
3T3
‑
L1
细胞成脂分化过程的化合物，包括以下步骤：
[0009]根据关键分子事件相关的多个体外试验数据判断化合物对关键分子事件是否有激动作用，构建关键分子事件数据库
。
[0010]基于致肥胖化学品的定义对化合物进行标签标注，构建对应的致肥胖化学品数据库
。
[0011]从所述关键分子事件数据库抽取部分化合物作为样本，基于所述样本的分子结构式提取对应的特异性分子特征
。
[0012]基于样本的特异性分子特征和是否有激动作用的标签组成样本数据集，并基于所述样本数据集对预构建的模型进行训练，以获得用于预测化合物是否对关键分子事件有激动作用的预测模型，所述预测模型包括多个关键分子事件对应的预测子模型
。
[0013]针对关键分子事件数据库和致肥胖化学品数据库进行化合物相似匹配，并将匹配重合的化合物作为标准数据集
。
[0014]基于所述标准数据集，分别用5‑
slice
方法与8‑
slice
方法计算得分，用得分和实际致肥胖结果绘制
ROC
曲线，比较
AUC
面积，选用预测准确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于机器学习的致肥胖化学品预测方法，所述致肥胖化学品是指能促进
3T3
‑
L1
细胞成脂分化过程的化合物，其特征在于，包括以下步骤：根据化合物对关键分子事件是否有激动作用，构建关键分子事件数据库；基于致肥胖化学品的定义对化合物进行标签标注，构建对应的致肥胖化学品数据库；从所述关键分子事件数据库抽取部分化合物作为样本，基于所述样本的分子结构式提取对应的特异性分子特征；基于样本的特异性分子特征和是否有激动作用的标签组成样本数据集，并基于所述样本数据集对预构建的模型进行训练，以获得用于预测化合物是否对关键分子事件有激动作用的预测模型，所述预测模型包括多个关键分子事件对应的预测子模型；针对关键分子事件数据库和致肥胖化学品数据库进行化合物相似匹配，并将匹配重合的化合物作为标准数据集；基于所述标准数据集，对所有预测子模型进行训练并整合训练结果，以获得预测模型的截断点；将待测化合物的分子结构式输入至预测模型，并基于截断点对预测结果进行判断，以获得待测化合物是否为致肥胖化合物的判断结果
。2.
根据权利要求1所述的基于机器学习的致肥胖化学品预测方法，其特征在于，所述致肥胖化学品数据库中的化合物，若能使
3T3
‑
L1
细胞的脂肪滴含量增多则标签为1，反之则为
0。3.
根据权利要求1所述的基于机器学习的致肥胖化学品预测方法，其特征在于，所述关键分子事件包括过氧化物酶体增殖物激活受体
、
糖皮质激素受体
、
...

【专利技术属性】
技术研发人员：刘璟，吴思颖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人