【技术实现步骤摘要】
消化内科电子数据分析方法
本专利技术涉及数据分析领域,尤其涉及一种消化内科电子数据分析方法。
技术介绍
肠道检查结果等医疗数据可以反映肠道情况,如果对肠道检查结果等医疗数据进行分析,可以了解肠癌情况。如何对肠道检查结果等医疗数据进行分析是当前需要解决的技术问题。
技术实现思路
本专利技术实施例提供一种消化内科电子数据分析方法,能够对消化内科电子数据进行分析,得到分析结果。本专利技术实施例采用如下技术方案:一种消化内科电子数据分析方法,包括:获取肠镜检查结果及病理检查结论,并将所述肠镜检查结果和所述病理检查结论进行比较,得出肠癌分析结果;针对所述肠癌分析结果统计特征,构建非齐次泊松过程NHPP类疾病分析可靠性增长模型;训练支持向量机SVM模型,以模型准确率为评估指标,将所述疾病分析可靠性增长模型在每一时间的可靠性结果作为惩罚因子,联合损失函数一起优化SVM模型,进行肠癌判断。可选的,所述获取肠镜检查结果及病理检查结论,并将所述肠镜检查结果和所述病理检查结论进行比较,得出肠癌分析结果包括:从同一个病患的肠镜检查报告和病理检查报告中提取特征信息,依据相应特征信息进行报告拼接 ...
【技术保护点】
1.一种消化内科电子数据分析方法,其特征在于,包括:获取肠镜检查结果及病理检查结论,并将所述肠镜检查结果和所述病理检查结论进行比较,得出肠癌分析结果;针对所述肠癌分析结果统计特征,构建非齐次泊松过程NHPP类疾病分析可靠性增长模型;训练支持向量机SVM模型,以模型准确率为评估指标,将所述NHPP类疾病分析可靠性增长模型在每一时间的可靠性结果作为惩罚因子,联合损失函数一起优化SVM模型,进行肠癌判断。
【技术特征摘要】
1.一种消化内科电子数据分析方法,其特征在于,包括:获取肠镜检查结果及病理检查结论,并将所述肠镜检查结果和所述病理检查结论进行比较,得出肠癌分析结果;针对所述肠癌分析结果统计特征,构建非齐次泊松过程NHPP类疾病分析可靠性增长模型;训练支持向量机SVM模型,以模型准确率为评估指标,将所述NHPP类疾病分析可靠性增长模型在每一时间的可靠性结果作为惩罚因子,联合损失函数一起优化SVM模型,进行肠癌判断。2.根据权利要求1所述的方法,其特征在于,所述获取肠镜检查结果及病理检查结论,并将所述肠镜检查结果和所述病理检查结论进行比较,得出肠癌分析结果包括:从同一个病患的肠镜检查报告和病理检查报告中提取特征信息,依据相应特征信息进行报告拼接整合;在对数据进行整合的过程中,以病理检查结果为准;其中,所述提取特征信息包括:文本型特征的提取、时间特征的提取和病人基本信息特征的提取;将所述文本型特征集成起来构建特征空间,从病理检查报告中提出相应疾病类别的描述词作为标签,构造输出空间,为特征空间各个特征的属性取值以及输出空间设定数值编码规则,通过设定好的数值编码规则,对整合后的报告数据进行数值化表示,使其成为计算机和算法模型可识别和学习的数值型数据;在对数据进行数值化表示后,以病理检查结论为最终结论,将肠镜检查结论和病理检查结论进行比较,以月为时间划分维度,统计出肠癌每个月的分析结果。3.根据权利要求2所述的方法,其特征在于,所述文本型特征的提取包括:对肠镜检查文本数据所做的文本处理称为医疗语言处理,这一过程中主要完成对肠镜检查文本数据的分词、噪声消除,并提取特定病症的阳性描述作为特征信息;所述时间特征的提取包括:检查日期在检查报告中是区间编码划分的字符串型数据,包括年月日,从中抽取月作为时间特征;所述病人基本信息特征的提取包括:提取的特征包括性别、年龄、职业。4.根据权利要求1所述的方法,其特征在于,所述针对所述肠癌分析结果统计特征,构建非齐次泊松过程NHPP类疾病分析可靠性增长模型包括:设置非齐次泊松过程NHPP;构建NHPP类计算结果可靠性增长模型框架;构建符合实际情况的NHPP类疾病可靠性增长模型;对符合实际情况的NHPP类疾病可靠性增长模型中的参数估计。5.根据权利要求4所述的方法,其特征在于,所述设置非齐次泊松过程NHPP包括:设置一随机的计数过程{N(t),t≥0}满足A1至A4:N代表一个计数过程,可以表示数量的多少,t表示时间;A1:N(0)=0;A2:{N(t),t≥0}是一个独立的增量过程;A3:P{[N(t+Δt)-N(t)]=1}=λ(t)Δt+o(Δt);λ(t)表示非齐次泊松过程的强度函数,Δt表示一个时间间隔,o(Δt)表示Δt的高阶无穷小函数;A4:P{N(t)-N(s)≥2}=o(Δt);则称{N(t),t≥0}为具有强度λ(t)的非齐次泊松过程,当λ(t)=λ时,非齐次泊松过程就是普通的齐次泊松过程;非齐次泊松过程的概率分布公式如下所示:S表示下一个时间,与t含义相同;N(t):在[0,t]时间段内发现的累计分析错误次数;m(t):[0,t]时间段内累计分析错误次数的期望值,m(t)=E[N(t)];x(t):到时刻t为止,被检测到且属于重复错诊的分析错误次数;a(t):疾病错诊总数函数,表示到时刻t为止,病例中统计到的分析错误次数总和;a0:统计开始时病例中存在的计算错误次数;b:计算错误率,表示病例中每个错误被统计到的概率;p(t):错误重复率函数,表示在时刻t,每个被检测到的错误属于重复出现的概率;R(x|t):疾病可靠性函数,表示从时刻t开始到t+x时间段内,疾病分析的可靠性。6.根据权利要求4或5所述的方法,其特征在于,所述构建NHPP类计算结果可靠性增长模型框架包括:基于所述非齐次泊松过程的概率分布公式,设定:B1:到时间t的累计分析错误次数N(t)服从均值函数为m(t)的泊松过程,任意时间间隔t到t+Δt内期望的分析错误发生数与t时刻剩余的分析错误数成比例。B2:疾病错诊数量在不同环境、不同时刻是不相同的,疾病分析错误总数是随时间变化的。B3:相同错诊情况在不同时间段都有可能发生,错诊重复率是时间的函数。B4:病例中每个分析错误是相互独立的,每个分析错误导致的后果严重性不同;由假设B1:有B5,B5:m(t+Δt)=b(a(t)-x(t))Δt+o(Δt),(a(t)-x(t))表示到时刻t为止,被检测到且不属于重复...
【专利技术属性】
技术研发人员:李霄剑,王亚雷,丁帅,孙斌,张宏敏,李杨,
申请(专利权)人:合肥工业大学,安徽医科大学第一附属医院,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。