一种常见妇科疾病预测模型构建方法和预测系统技术方案

技术编号:25712304 阅读:21 留言:0更新日期:2020-09-23 02:58
本发明专利技术涉及一种常见妇科疾病预测模型构建方法及预测系统,所述预测模型构建方法如下:获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本;根据病历样本推断每个检查项目指标数据的概率以及各检查项目总体相似性概率;建立包含妇科疾病知识、检查项目指标数据的概率、患者临床症状概率之间相互匹配的数据库;对所述数据库进行文本特征提取,通过文本相似度计算构建预测模型。本发明专利技术基于多数据源构建的数据库,运用机器学习方法,构建一个高准确率的常见妇科疾病预测模型和系统,不仅能用于基层医生学习与参考,也便于患者早期预测与预防,具有一定的推广应用价值。

【技术实现步骤摘要】
一种常见妇科疾病预测模型构建方法和预测系统
本专利技术涉及智能医疗以及医疗信息
,尤其涉及一种常见妇科疾病预测模型构建方法和预测系统。
技术介绍
根据世界卫生组织(WHO)的调查显示,我国有96%以上的已婚妇女患有不同程度的妇科疾病,常见的妇科病发病率在87.6%以上。其中妇女宫颈癌的发病率占世界的1/3左右。现实生活中,很多女性对自身身体以及妇科疾病缺乏足够的了解和认识。目前,超声、磁共振、计算机断层扫描、阴道镜、宫腔镜等影像技术以及液基细胞学、基因检测、白带分析、宫颈切片等技术是妇科病特别是妇科疾病恶性肿瘤筛查、诊断、分期、疗效评估、治疗以及随访的重要手段。这些检查基本都依赖于各种设备和条件以及医生个人临床经验,易造成误诊和漏诊不说,而且筛查、诊断、定性的时间比较长。随着不断增加的工作量和迫在眉睫的医生短缺,常见妇科疾病自查、评估与预测需要一种更简单、快捷、智能,同时不受各种主、客观条件限制的替代品,从而改变上述技术和方法因受主客观条件限制、诊断定性时间较长、而且不准确导致处置工作陷于被动局面的系统。
技术实现思路
本专利技术针对现有技术中存在的技术问题,提供一种常见妇科疾病预测模型构建方法,获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本;根据病历样本推断每个检查项目指标数据的概率以及各检查项目总体相似性概率;建立包含妇科疾病知识、检查项目指标数据的概率、患者临床症状概率之间相互匹配的数据库;对所述数据库进行文本特征提取,通过文本相似度计算构建预测模型。>在本专利技术的一些实施例中,为提高数据的准确率,所述获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本的过程还包括对上述数据进行预处理。进一步的,所述预处理包括提取数值的正常参考区间值和异常范参考区间值,以及对文本描述进行特征关键词提取并进行归一化处理。在本专利技术的一些实施例中,所述根据病历样本推断每个检查项目指标数据的概率过程具体为:通过每种妇科病患者样本计算出该种妇科病检查和分析的总体平均指标、临床症状特征相似性百分比。在本专利技术的一些实施例中,所述对所述数据库进行文本特征提取的过程通过文本挖掘方法和机器学习进行。在本专利技术的一些实施例中,所述文本挖掘方法包括Adaboos或支持向量机。本专利技术另一方面还提供了一种常见妇科疾病预测系统,采集模块,用于获取常见妇科疾病所需的检查项目、检查指标、妇科疾病知识以及病历样本;匹配模块,用于根据病历样本推断每个检查项目指标数据的概率以及各检查项目总体相似性概率;建立包含妇科疾病知识、检查项目指标数据的概率、患者临床症状概率之间相互匹配的数据库;计算模块,用于对所述数据库进行文本特征提取,通过文本相似度计算构建预测模型;确定模块,用于对目标患者的临床症状进行选择和匹配,预测目标患者患病的概率。在本专利技术的一些实施例中,为了提高数据的有效性和实时性以及预测的准确性,所述采集模块定期对采集数据进行更新。在本专利技术的一些实施例中,所述匹配模块根据贝叶斯模型或马尔可夫模型来推断各检查项目总体相似性概率。所述确定模块通过加权算法对患者临床症状特征词频、对患者临床症状的文本特征以及妇科疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成患者临床症状文本特征分词以及妇科疾病信息的文本特征分词。本专利技术基于常见妇科疾病样本、检查项目的基础标准和妇科病所需知识,通过加权计算,获取可能的概率,再结合临床症状特征进行选择和匹配,可以实现常见妇科疾病的快速筛查和智能诊断,解决妇女实际生活、工作中遇到的各种实际问题。附图说明图1为本专利技术常见妇科疾病预测模型构建方法基本流程图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。本专利技术针对现有技术中存在的技术问题,提供一种常见妇科疾病预测模型构建方法,获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本;根据病历样本推断每个检查项目指标数据的概率以及各检查项目总体相似性概率;建立包含妇科疾病知识、检查项目指标数据的概率、患者临床症状概率之间相互匹配的数据库;对所述数据库进行文本特征提取,通过文本相似度计算构建预测模型。例如,常见妇科病所需的各种检测项目包括括B超检查指标、白带分析指标、宫腔镜检查指标、临床症状指标和具体妇科病概念、知识和名称等。在本专利技术的一些实施例中,为提高数据的准确率,所述获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本的过程还包括对上述数据进行预处理。进一步的,所述预处理包括提取数值的正常参考区间值和异常范参考区间值,以及对文本描述进行特征关键词提取并进行归一化处理。具体地,如果采集得到的数据是数值,那么提取这些要素数据的正常范围参考区间值和异常范围参考区间值(按照《诊断学》和国际、国内相关指标科学的确定的标准,纳入相对统一的正常范围参考区间值和异常范围参考区间值);如果是文本描述,那么提取文本中的特征关键词或者短语,并进行归一化处理;比如,妇科疾病的白带常规检查,一般是通过阴道PH值、阴道清洁度、阴道微生物检查等5项检查,来判断女性是否白带异常。具体包括:1、pH值。化验时常用pH值来表示酸碱度,正常时pH为4.5,患有滴虫性或细菌性阴道炎时白带的pH值上升,可大于5~6;2、阴道清洁度可分为4级:Ⅰ度:显微镜下见到大量阴道上皮细胞和大量阴道杆菌;Ⅱ度:镜下见有阴道上皮细胞,少量白细胞,有部分阴道杆菌,可有少许杂菌或脓细胞;Ⅲ度:镜下见有少量阴道杆菌,有大量脓细胞与杂菌;Ⅳ度:镜下未见到阴道杆菌,除少量上皮细胞外主要是脓细胞与杂菌。其中:Ⅰ~Ⅱ为正常。Ⅲ~Ⅳ为异常,可能为阴道炎,同时常可发现病原菌、真菌、阴道滴虫等,作清洁度检查时应同时作滴虫、真菌检查;3、霉菌与滴虫白带经过处理后在显微镜下可以根据其形态发现有无滴虫或霉菌,如存在滴虫或霉菌不论其数量多寡均用“+”来表示,“+”这一符号只说明该妇女感染了滴虫或霉菌,并不说明其感染的严重程度;4、胺试验:患细菌性阴道病的白带可发出鱼腥味,它是由存在于白带中的胺经氢氧化钾碱化后挥发出来所致;5、线索细胞:根据胺试验阳性及有线索细胞即可做出细菌性阴道病的诊断。在在本专利技术的一些实施例中,采集并处理这些检查数值指标的范围参考区间值以及文本描述分词或者短语可能对应的疾病和病因,包括可能对应的疾病和病因以及不同人群、不同年龄阶段、不同指标(状态)异常变化可能对应的疾病和病因,对这些数据和知识进行预处理。再比如,1、脓性白带:白带色黄或黄绿,如脓样,有臭味。一般由感染造成,常见于滴虫性阴道炎,慢性宫颈炎、阴道炎、子宫内膜炎等;2、无色透明粘液性白带:外观与排卵期的正常白带相似,量多,常见于应用雌激素类药物后;3、血性白带:白带如染血,应警惕宫颈癌、宫体癌等恶性肿瘤。宫颈息肉、重度慢性宫颈炎、宫内节育器、老年性阴道炎、粘膜下子宫肌瘤等良性病变也会有此症状;4、豆腐渣样白带:是霉菌性阴道本文档来自技高网...

【技术保护点】
1.一种常见妇科疾病预测模型构建方法,其特征在于,包括如下步骤:/n获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本;/n根据病历样本推断每个检查项目指标数据的概率以及各检查项目总体相似性概率;建立包含妇科疾病知识、检查项目指标数据的概率、患者临床症状概率之间相互匹配的数据库;/n对所述数据库进行文本特征提取,通过文本相似度计算构建预测模型。/n

【技术特征摘要】
1.一种常见妇科疾病预测模型构建方法,其特征在于,包括如下步骤:
获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本;
根据病历样本推断每个检查项目指标数据的概率以及各检查项目总体相似性概率;建立包含妇科疾病知识、检查项目指标数据的概率、患者临床症状概率之间相互匹配的数据库;
对所述数据库进行文本特征提取,通过文本相似度计算构建预测模型。


2.根据权利要求1所述的常见妇科疾病预测模型构建方法,其特征在于,所述获取常见妇科病疾所需的检查项目、检查指标、妇科疾病知识以及病历样本的过程还包括对上述数据进行预处理。


3.根据权利要求2所述的常见妇科疾病预测模型构建方法,其特征在于,所述预处理包括提取数值的正常参考区间值和异常范参考区间值,
以及对文本描述进行特征关键词提取并进行归一化处理。


4.根据权利要求1或2所述的常见妇科疾病预测模型构建方法,其特征在于,所述根据病历样本推断每个检查项目指标数据的概率过程具体为:
通过每种妇科病患者样本计算出该种妇科病检查和分析的总体平均指标、临床症状特征相似性百分比。


5.根据权利要求1或2所述的常见妇科疾病预测模型构建方法,其特征在于,所述对所述数据库进行文本特征提取的过程通过文本挖掘方法和机器学习进行。

【专利技术属性】
技术研发人员:杜乐
申请(专利权)人:吾征智能技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1