一种基于UPLC-MS技术推断大鼠死亡时间的方法技术

技术编号:29486259 阅读:15 留言:0更新日期:2021-07-30 18:57
本发明专利技术涉及法医学领域,具体是一种基于UPLC‑MS技术推断大鼠死亡时间的方法,收集死亡后大鼠骨骼肌样本,提取的小分子化合物,通过UPLC‑MS技术进行代谢组学检测;对色谱峰识别、峰对齐,获得化合物名称、保留时间、精确质荷比和峰面积,峰面积归一化,获得差异小分子化合物集合;将差异小分子化合物的含量导入三级串联预测模型中,进行逐级预测,得到一级预测结果后,导入相应的二级预测模型中,然后导入对应的三级模型中,最后得出预测的死亡时间。本发明专利技术采用UPLC‑MS技术把三级死亡时间推断模型串联起来对样本进行预测。三级串联预测模型进行分段分步鉴别死亡时间,提高死亡时间预测的准确性和缩短死亡时间鉴别的时间窗口。

【技术实现步骤摘要】
一种基于UPLC-MS技术推断大鼠死亡时间的方法
本专利技术涉及法医学领域,具体是一种基于UPLC-MS技术推断大鼠死亡时间的方法。
技术介绍
死亡时间(postmorteminterval,PMI)是指发现尸体或检验尸体的时间点与发生死亡的时间点之间的时间间隔。推断死亡时间是法医尸检的一项重要任务,对确定作案时间、调查犯罪现场、筛查犯罪嫌疑人有重要意义。死亡时间的推断方法包括观察死后变化和实验室的生化检测等检测手段,目前对于较早期死亡时间推断的研究较为全面(死亡时间≤24小时),但是对于较晚期死亡时间推断的研究相对匮乏(尤其是死亡时间≥15天)。这是由于随着死亡时间的延长,组织细胞发生自溶,蛋白质和核酸逐渐降解,难以检测。但是,代谢产物相对不易降解,并且代谢组学对于被检样本质量的要求也比较宽松。所以,代谢组学技术或许更适用于研究较晚期死亡时间推断。起初,用于推断PMI的金标准是基于温度的列线图方法,除此之外,还会参考一些死后变化,如尸斑、尸僵、角膜浑浊等,但是根据死后变化推断PMI主要是依靠丰富的知识和检案经验等主观因素。因此,寻找更加有效的技术方法或客观的生物指标来推断死亡时间就显得尤为重要。后来有研究发现对滑液和玻璃体液进行生化检测可用于推断PMI,蛋白质的降解也被证明与死亡时间存在一定的关系。而死后尸体在微生物作用下逐渐发生腐败,各种小分子化合物在组织中消耗、生成、积累,腐败微生物和腐败产物的量随着死亡时间的延长,而不断变化。代谢组学技术可以通过单次检测对成百上千的小分子进行定性定量研究,在筛选标志物上有着一定优势。另外,生物体内小分子种类极为相似,构建动物模型有利于推广应用到实践中。因此,我们认为检测死后小分子物质的变化可能有助于推断PMI。近年来,代谢组学发展成为研究生命科学的热门领域,可以通过对肌肉、体液及其他检材进行高通量分析,提供非常全面的小分子化合物信息。目前,法医学者已应用代谢组学技术进行不同方向的研究:研究生物死后组织或体液中代谢物的变化以推断PMI;检测滥用药物及其代谢物;法医相关病理损伤后组织或体液可能出现的代谢变化。随着人工智能的快速发展,机器学习算法被广泛地应用于科学研究的各个领域。机器学习算法主要是指通过数学及统计学方法求解最优化问题的过程,针对不同的数据和不同的模型需求,选择合适的算法可以更高效地解决实际问题。代谢组学技术作为一种高通量、高灵敏度的检测方法,可以获得庞大的原始数据,应用机器学习算法可以更全面地挖掘出数据背后隐藏的生物学意义,建立更加准确、可靠的预测模型。在当前的法医学死亡时间推断的研究中,不论是从基因层面、蛋白质层面还是代谢物层面来看,对于相对较短死亡时间的推断研究都已经较为成熟且建立了具有较高预测准确度的数学模型,但是由于个体差异、环境等影响因素的存在,目前的研究尚未应用于实践。此外,目前关于相对较晚期死亡时间的推断研究仍然较为缺乏。
技术实现思路
本专利技术为了解决较晚期死亡时间推断的关键科学问题和实践难点,提供了一种基于UPLC-MS技术推断大鼠死亡时间的方法。本专利技术采用UPLC-MS技术,检测不同死亡时间的大鼠骨骼肌组织,筛选出与死亡时间相关的差异小分子化合物,结合神经网络算法,构建三级死亡时间推断模型,最后把三级死亡时间推断模型串联起来对样本进行预测。三级串联预测模型进行分段分步鉴别死亡时间,提高死亡时间预测的准确性和缩短死亡时间鉴别的时间窗口。本专利技术是通过以下技术方案实现的:大鼠死亡时间推断模型的建立方法,包括以下步骤:㈠收集死亡后不同时间点收集的大鼠骨骼肌样本,提取的小分子化合物,通过UPLC-MS技术进行代谢组学检测;对色谱峰识别、峰对齐,获得化合物名称、保留时间、精确质荷比和峰面积,峰面积归一化,获得随死亡时间变化的化合物数据集;㈡依据化合物在不同死亡时间样本中含量不同,通过主成份分析获得大鼠死亡时间分段信息,根据正交偏最小二乘判别针对每一个死亡时间段筛选差异化合物以变量权重重要性排序和t检验中P<0.05为原则,筛选用于死亡时间推断数学模型的潜在差异化合物集合,并根据和数据库中二级质谱图比对,共确定了25种内源性化合物作为差异小分子化合物集合;㈢打开Clementine12.0,分步建立三级串联预测模型:(1)建立一级预测模型A第一步:选择源选项里的Excel选项,将用于预测0天、1-3天、5-7天、9-15天和18-30天死亡时间段的19个差异小分子化合物含量导入,19个差异小分子化合物为DL-色氨酸、异戊胺、油酸酰胺、邻羟基肉桂酸、N-乙酰-L-苯基丙氨酸、脯氨酸、甲硫氨酸、吲哚-3-乳酸、(+/-)12(13)-DiHOME、L-苯丙氨酸、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、泛酸、尿苷、2-巯基苯并噻唑、8(S)-羟基-(5Z,9E,11Z,14Z)-二十碳四烯酸、L-酪氨酸、L-丝氨酸;第二步:选择字段选项里的类型选项,判别变量为19个差异小分子化合物,死亡时间分组变量包括a:0天,b:1-3天,c:5-7天,d:9-15天,e:18-30天,死亡时间分组为输出变量,依次读入数据;第三步:选择记录选项里的样本选项,将原始数据随机抽样大部分用作训练集,少部分用作内部验证集;第四步:选择建模选项里的神经网络选项,然后运行,训练神经网络一级预测模型A的超参数,得到最优预测模型以及内部验证评价模型;(2)建立二级预测模型①建立二级预测模型B第一步:选择源选项里的Excel选项,将用于鉴别1天、2天、3天死亡时间点的14个差异小分子化合物含量导入,14个差异小分子化合物为DL-色氨酸、5-氨基戊酸、异戊胺、油酸酰胺、N-乙酰-L-苯基丙氨酸、脯氨酸、甲硫氨酸、吲哚-3-乳酸、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、缬氨酸、尿苷、L-酪氨酸;第二步:选择字段选项里的类型选项,死亡时间分组变量包括1天、2天和3天;判别变量为上述14个差异化合物;死亡时间分组设置为输出变量,读入数据;第三步:选择记录选项里的样本选项,将原始数据随机抽样大部分用作训练集,少部分用作内部验证集;第四步:选择建模选项里的神经网络选项,然后运行,训练神经网络二级预测模型B的超参数,得到最优预测模型以及内部验证评价模型;②建立二级预测模型C的步骤为:第一步:选择源选项里的Excel选项,将用于鉴别5天、7天死亡时间点的15个差异小分子化合物含量导入,15个差异小分子化合物为DL-色氨酸、5-氨基戊酸、油酸酰胺、邻羟基肉桂酸、N-乙酰-L-苯基丙氨酸、脯氨酸、甲硫氨酸、吲哚-3-乳酸、L-苯基丙氨酸、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、2-巯基苯并噻唑、L-丝氨酸、L-酪氨酸;第二步:选择字段选项里的类型选项,死亡时间分组变量包括5天和7天,判别变量为上述15个差异小分子化合物,死亡时间分组设置为输出变量,读入数据;第三步:选择记录选项里的样本选项,将原始数据随本文档来自技高网
...

【技术保护点】
1.大鼠死亡时间推断模型的建立方法,其特征在于,包括以下步骤:/n㈠收集死亡后不同时间点收集的大鼠骨骼肌样本,提取的小分子化合物,通过UPLC-MS技术进行代谢组学检测;对色谱峰识别、峰对齐,获得化合物名称、保留时间、精确质荷比和峰面积,峰面积归一化,获得随死亡时间变化的化合物数据集;/n㈡依据化合物在不同死亡时间样本中含量不同,通过主成份分析获得大鼠死亡时间分段信息,根据正交偏最小二乘判别针对每一个死亡时间段筛选差异化合物以变量权重重要性排序和t检验中

【技术特征摘要】
1.大鼠死亡时间推断模型的建立方法,其特征在于,包括以下步骤:
㈠收集死亡后不同时间点收集的大鼠骨骼肌样本,提取的小分子化合物,通过UPLC-MS技术进行代谢组学检测;对色谱峰识别、峰对齐,获得化合物名称、保留时间、精确质荷比和峰面积,峰面积归一化,获得随死亡时间变化的化合物数据集;
㈡依据化合物在不同死亡时间样本中含量不同,通过主成份分析获得大鼠死亡时间分段信息,根据正交偏最小二乘判别针对每一个死亡时间段筛选差异化合物以变量权重重要性排序和t检验中P<0.05为原则,筛选用于死亡时间推断数学模型的潜在差异化合物集合,并根据和数据库中二级质谱图比对,共确定了25种内源性化合物作为差异小分子化合物集合;
㈢打开Clementine12.0,分步建立三级串联预测模型:
(1)建立一级预测模型A
第一步:选择源选项里的Excel选项,将用于预测0天、1-3天、5-7天、9-15天和18-30天死亡时间段的19个差异小分子化合物含量导入,19个差异小分子化合物为DL-色氨酸、异戊胺、油酸酰胺、邻羟基肉桂酸、N-乙酰-L-苯基丙氨酸、脯氨酸、甲硫氨酸、吲哚-3-乳酸、(+/-)12(13)-DiHOME、L-苯丙氨酸、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、泛酸、尿苷、2-巯基苯并噻唑、8(S)-羟基-(5Z,9E,11Z,14Z)-二十碳四烯酸、L-酪氨酸、L-丝氨酸;
第二步:选择字段选项里的类型选项,判别变量为19个差异小分子化合物,死亡时间分组变量包括a:0天,b:1-3天,c:5-7天,d:9-15天,e:18-30天,死亡时间分组为输出变量,依次读入数据;
第三步:选择记录选项里的样本选项,将原始数据随机抽样大部分用作训练集,少部分用作内部验证集;
第四步:选择建模选项里的神经网络选项,然后运行,训练神经网络一级预测模型A的超参数,得到最优预测模型以及内部验证评价模型;
(2)建立二级预测模型
①建立二级预测模型B
第一步:选择源选项里的Excel选项,将用于鉴别1天、2天、3天死亡时间点的14个差异小分子化合物含量导入,14个差异小分子化合物为DL-色氨酸、5-氨基戊酸、异戊胺、油酸酰胺、N-乙酰-L-苯基丙氨酸、脯氨酸、甲硫氨酸、吲哚-3-乳酸、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、缬氨酸、尿苷、L-酪氨酸;
第二步:选择字段选项里的类型选项,死亡时间分组变量包括1天、2天和3天;判别变量为上述14个差异化合物;死亡时间分组设置为输出变量,读入数据;
第三步:选择记录选项里的样本选项,将原始数据随机抽样大部分用作训练集,少部分用作内部验证集;
第四步:选择建模选项里的神经网络选项,然后运行,训练神经网络二级预测模型B的超参数,得到最优预测模型以及内部验证评价模型;
②建立二级预测模型C的步骤为:
第一步:选择源选项里的Excel选项,将用于鉴别5天、7天死亡时间点的15个差异小分子化合物含量导入,15个差异小分子化合物为DL-色氨酸、5-氨基戊酸、油酸酰胺、邻羟基肉桂酸、N-乙酰-L-苯基丙氨酸、脯氨酸、甲硫氨酸、吲哚-3-乳酸、L-苯基丙氨酸、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、2-巯基苯并噻唑、L-丝氨酸、L-酪氨酸;
第二步:选择字段选项里的类型选项,死亡时间分组变量包括5天和7天,判别变量为上述15个差异小分子化合物,死亡时间分组设置为输出变量,读入数据;
第三步:选择记录选项里的样本选项,将原始数据随机抽样大部分用作训练集,少部分用作内部验证集;
第四步:选择建模选项里的神经网络选项,然后运行,训练神经网络二级预测模型C的超参数,得到最优预测模型以及内部验证评价模型;
③建立二级预测模型D
第一步:选择源选项里的Excel选项,将用于鉴别的9天、12天和15天的21个差异小分子化合物含量导入,21个差异小分子化合物为DL-色氨酸、异戊胺、5-氨基戊酸、油酸酰胺、苯乙胺、邻羟基肉桂酸、N-乙酰-L-苯基丙氨酸、脯氨酸、甲硫氨酸、吲哚-3-乳酸、(+/-)12(13)-DiHOME、胸腺嘧啶、L-苯基丙氨酸、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、甲氨酰胺、2-巯基苯并噻唑、8(S)-羟基-(5Z,9E,11Z,14Z)-二十碳四烯酸、L-丝氨酸、L-酪氨酸;
第二步:选择字段选项里的类型选项,死亡时间分组变量包括9天、12天和15天,判别变量为上述21个差异小分子化合物,死亡时间分组设置为输出变量,读入数据;
第三步:选择记录选项里的样本选项,将原始数据随机抽样大部分用作训练集,少部分用作内部验证集;
第四步:选择建模选项里的神经网络选项,然后运行,训练神经网络二级预测模型D的超参数,得到最优预测模型以及内部验证评价模型;
④建立二级预测模型E
第一步:选择源选项里的Excel选项,将用于鉴别的18-24天和27-30天的15个差异小分子化合物含量导入,15个差异小分子化合物为DL-色氨酸、异戊胺、5-氨基戊酸、N-乙酰-L-苯基丙氨酸、甲硫氨酸、吲哚-3-乳酸、(+/-)12(13)-DiHOME、DL-苹果酸、还原型L-谷胱甘肽、N-乙酰-DL-色氨酸、缬氨酸、DL-高丝氨酸、尿苷、2-巯基苯并噻唑、L-丝氨酸;
第二步:选择字段选项里的类型选项,死亡时间分组变量18-24天和27-30天,判别变量为上述15个差异小分子化合物,死亡时间分组设置为输出变量,读入数据;
第三步:选择记录选项里的样本选项,将原始数据随机抽样大部分用作训练集,少部分用作内部验证集;
第四步:选择建模选项里的神经网络选项,然后运行,训练神经网络二...

【专利技术属性】
技术研发人员:杜秋香曹洁谷祯党丽虹卢晓军安国帅王英元孙俊红
申请(专利权)人:山西医科大学
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1