一种基于尿液代谢组数据的尿结石风险预测方法及其系统技术方案

技术编号:39805051 阅读:9 留言:0更新日期:2023-12-22 02:38
本发明专利技术提出基于尿液代谢组数据的尿结石风险预测方法及其系统,其方法包括采用质谱分析法对尿液样本中的代谢物进行检测和定量,并获取对应的原始数据;对原始数据进行滤波

【技术实现步骤摘要】
一种基于尿液代谢组数据的尿结石风险预测方法及其系统


[0001]本专利技术涉及医疗数据处理
,尤其涉及一种基于尿液代谢组数据的尿结石风险预测方法及其系统


技术介绍

[0002]尿结石是指在人体的泌尿系统内形成的固体结晶物质,其成分多种多样,包括草酸钙

草酸铵

磷酸钙

尿酸等

尿结石的形成过程是一个复杂的生化反应过程,主要包括以下几个步骤:饮食和代谢因素:饮食中的某些物质(如高蛋白质

高盐

高糖)以及代谢产物(如尿酸

草酸等)可以促进结石的形成

聚集:尿液中的溶解物质逐渐沉淀并聚集形成小结晶

生长:小结晶不断吸收尿液中的溶解物质并逐渐增大,最终形成可见的结石

粘附:结石表面具有一定的电荷特性,可以吸附细菌和其他微生物,形成感染源

移行:结石可以通过尿道

输尿管等部位移行,并引起疼痛和不适等症状

[0003]采用尿液代谢组数据进行尿结石的分析,具体的分析过程为:样本采集:收集患者的尿液样本,并保存在低温条件下,避免代谢物质的降解和变化

数据获取:使用代谢组学技术(如质谱分析

核磁共振等)对尿液样本进行分析,获得代谢物质的定量和定性信息

数据预处理:对代谢物质的数据进行去噪
/>校正和归一化等预处理步骤,以保证数据的准确性和可比性

统计分析:使用统计学方法对代谢物质的数据进行分析,包括聚类分析

主成分分析

差异分析等,以确定不同样本之间的差异和相似性

生物信息学分析:将代谢物质的数据与生物信息学数据库进行比对和注释,以识别与尿结石相关的代谢通路和生物标志物

结果解释:根据分析结果,评估患者尿结石的风险和类型,并制定个性化的治疗方案

[0004]但现有技术中的尿液代谢组数据进行尿结石的分析存在如下弊端:(1)样本收集:尿液样本的质量和数量可能受到多种因素的影响,如采集时间

饮食

药物使用等

因此,样本收集过程需要严格控制,以确保数据的准确性和可靠性

[0005](2)数据处理:代谢组学技术的数据处理过程较为复杂,需要运用多种算法和软件进行预处理

统计分析和生物信息学分析

不同算法和软件之间的结果可能存在差异,需要经过反复验证和比对才能确定最终结果

[0006](3)数据解释:尿液代谢组数据分析的结果需要进一步与临床表现和其他检查结果相结合,才能作出准确的诊断和治疗决策

因此,需要具备专业的临床知识和经验,才能对数据进行科学的解释和应用

[0007](4)个体差异:尿液代谢组数据在不同个体之间存在显著差异,如年龄

性别

体重

饮食等因素都会对代谢物质的水平和类型产生影响

因此,需要考虑个体差异的影响,制定个性化的分析和治疗方案


技术实现思路

[0008]为了解决上述问题,本专利技术提出一种基于尿液代谢组数据的尿结石风险预测方法及其系统,以通过机器学习方法,对大量的尿液代谢组数据进行训练,并构建出一个高效的
分类模型或预测模型,以便在未来的样本中快速而准确地识别和预测尿结石的发生

同时,通过该技术还能够深入挖掘和解释代谢组数据中的关键特征和变化,从而更好地理解尿结石形成的机制和规律

此外,该技术还能够实现个体差异的自适应调整和优化,提高尿液代谢组数据分析的准确性和稳定性

[0009]本专利技术通过以下技术方案实现的:本专利技术提出一种基于尿液代谢组数据的尿结石风险预测方法,包括:采用质谱分析法对尿液样本中的代谢物进行检测和定量,并获取对应的原始数据;对所述原始数据进行滤波

差值

归一化以及去除离群点的第一次数据处理以生成待分析数据;利用马尔可夫模型对所述待分析数据进行特征确定的统计过程,并根据支持向量机对统计后的各个所述待分析数据中的子数据进行向量设置和个体建模,其中,所述子数据通过马尔可夫模型的特征确定进行标记;将确定的子数据向量

个体建模和各个所述子数据导入至神经网络预测模型中,并采集所述神经网络预测模型经过处理后输出的个体建模图

尿结石分析结果和尿结石患病概率;将所述个体建模图

尿结石分析结果和尿结石患病概率作为预测结果进行输出

[0010]进一步地,所述采用质谱分析法对尿液样本中的代谢物进行检测和定量,并获取对应的原始数据的步骤,包括:采用液相色谱

质谱联用法对所述尿液样本进行高效液相色谱柱物质分离,生成第一样本数据;采用气相色谱

质谱联用法对所述尿液样本进行气态化合物检测,生成第二样本数据;并获取对尿液样本进行注射质谱法后的检测数据;整合所述第一样本数据与所述第二样本数据生成所述原始数据,并将所述原始数据与检测数据进行比对判断原始数据误差阈值是否低于预设值;若是,则获取所述原始数据

[0011]进一步地,对所述原始数据进行滤波

差值

归一化以及去除离群点的第一次数据处理以生成待分析数据的步骤,包括:滤波:采用
Butterworth
数字滤波器对所述原始数据进行处理,去除高频噪声和低频漂移并保留中频部分;差值:采用二阶差分算法将原始数据转换成差分形式生成出代谢物浓度的变化趋势;归一化:采用
Z

score
归一化消除原始数据中各个子数据之间的浓度差异;去除离群点:依照滤波保留的中频部分对原始数据进行中位数绝对偏差以排除异常值

[0012]进一步地,所述利用马尔可夫模型对所述待分析数据进行特征确定的统计过程,并根据支持向量机对统计后的各个所述待分析数据中的子数据进行向量设置和个体建模的步骤,包括:
通过所述马尔可夫模型对待分析数据中的各个子序列进行分类,并采用转移概率矩阵和稳态概率分布对各个所述子序列进行关键特征提取过程;对各个所述子序列进行数学向量转化生成与各个子序列匹配的序列向量,并根据所述关键特征提取过程对各个序列向量进行维度和特征权重的设置;创建三维坐标系
XYZ
,分别为液态浓度特征
X、
气态浓度特征
Y、
尿结石患病概率
Z
;将各个进行维度和特征权重设置后的序列向量输入至所述三维坐本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于尿液代谢组数据的尿结石风险预测方法,其特征在于,包括:采用质谱分析法对尿液样本中的代谢物进行检测和定量,并获取对应的原始数据;对所述原始数据进行滤波

差值

归一化以及去除离群点的第一次数据处理以生成待分析数据;利用马尔可夫模型对所述待分析数据进行特征确定的统计过程,并根据支持向量机对统计后的各个所述待分析数据中的子数据进行向量设置和个体建模,其中,所述子数据通过马尔可夫模型的特征确定进行标记;将确定的子数据向量

个体建模和各个所述子数据导入至神经网络预测模型中,并采集所述神经网络预测模型经过处理后输出的个体建模图

尿结石分析结果和尿结石患病概率;将所述个体建模图

尿结石分析结果和尿结石患病概率作为预测结果进行输出
。2.
根据权利要求1所述的基于尿液代谢组数据的尿结石风险预测方法,其特征在于,所述采用质谱分析法对尿液样本中的代谢物进行检测和定量,并获取对应的原始数据的步骤,包括:采用液相色谱

质谱联用法对所述尿液样本进行高效液相色谱柱物质分离,生成第一样本数据;采用气相色谱

质谱联用法对所述尿液样本进行气态化合物检测,生成第二样本数据;并获取对尿液样本进行注射质谱法后的检测数据;整合所述第一样本数据与所述第二样本数据生成所述原始数据,并将所述原始数据与检测数据进行比对判断原始数据误差阈值是否低于预设值;若是,则获取所述原始数据
。3.
根据权利要求1所述的基于尿液代谢组数据的尿结石风险预测方法,其特征在于,对所述原始数据进行滤波

差值

归一化以及去除离群点的第一次数据处理以生成待分析数据的步骤,包括:滤波:采用
Butterworth
数字滤波器对所述原始数据进行处理,去除高频噪声和低频漂移并保留中频部分;差值:采用二阶差分算法将原始数据转换成差分形式生成出代谢物浓度的变化趋势;归一化:采用
Z

score
归一化消除原始数据中各个子数据之间的浓度差异;去除离群点:依照滤波保留的中频部分对原始数据进行中位数绝对偏差以排除异常值
。4.
根据权利要求1所述的基于尿液代谢组数据的尿结石风险预测方法,其特征在于,所述利用马尔可夫模型对所述待分析数据进行特征确定的统计过程,并根据支持向量机对统计后的各个所述待分析数据中的子数据进行向量设置和个体建模的步骤,包括:通过所述马尔可夫模型对待分析数据中的各个子序列进行分类,并采用转移概率矩阵和稳态概率分布对各个所述子序列进行关键特征提取过程;对各个所述子序列进行数学向量转化生成与各个子序列匹配的序列向量,并根据所述关键特征提取过程对各个序列向量进行维度和特征权重的设置;创建三维坐标系
XYZ
,分别为液态浓度特征
X、
气态浓度特征
Y、
尿结石患病概率
Z
;将各个进行维度和特征权重设置后的序列向量输入至所述三维坐标系中,通过各个序
列向量中的液态浓度特征
X
和气态浓度特征
Y
输入在三维坐标系中构建出第一三维坐标系
XY。5.
根据权利要求4所述的基于尿液代谢组数据的尿结石风险预测方法,其特征在于,所述将确定的子数据向量

个体建模和各个所述子数据导...

【专利技术属性】
技术研发人员:罗宏敏杨江涛鲁艳姜盼盼吴莉萍
申请(专利权)人:深圳爱湾医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1