本发明专利技术公开一种基于口酸的疾病辅助诊断系统、设备、存储介质,所述系统包括:样本获取模块:从病例库中获取以口酸为第一主诉症状的病例,提取病例症状信息及对应的疾病名称,构建向量化的病例样本;样本标记模块:根据病例样本的疾病的发病原因,对病例样本标记;模型构建模块:通过Adaboost算法构建疾病分类模型,通过所述病例样本训练所述疾病分类模型;辅助诊断模块:获取待诊断病例的症状信息并进行向量化表示,通过训练好的疾病分类模型进行病例第一次分类,通过计算语义相似度的方式进行病例第二次分类,将第二次分类结果作为辅助诊断结果。本发明专利技术通过Adaboost算法构建疾病分类模型,实现了以口酸为第一主诉症状的快速疾病辅助诊断。
【技术实现步骤摘要】
一种基于口酸的疾病辅助诊断系统、设备、存储介质
本专利技术涉及疾病辅助诊断设备领域,一种基于口酸的疾病辅助诊断系统、设备、存储介质。
技术介绍
俗话说,“鼻闻香臭,舌尝五味”。酸、甜、苦、辣、咸五味的信息,是靠舌面上密布的细小乳头,称为舌蕾的味觉细胞来传递的,再经大脑皮质味觉中枢产生兴奋,由反馈环路神经体液系统完成整个味的分析活动。但是有的人在进食时,口中会有异味感,或者不进食口腔内也觉得有异常味道。这常常提示可能得了某种疾病。中医认为,口酸多为肝胆之热侵脾所致,是肝气上溢的征兆,常伴有胸闷胁痛、恶心、食后腹胀、舌苔薄黄、脉弦等症状。常见于胃炎和消化性溃疡,与胃酸过多有关。比如,胃炎、胃酸、感冒和胃及十二指肠溃疡胃酸等。现有技术中很难根据直接根据口腔异味直接做出准确的疾病诊断,需要借助多种辅助检测设备并结合医师经验判断,诊断过程繁琐且有主观性影响。
技术实现思路
有鉴于此,本专利技术提出了一种基于口酸的疾病辅助诊断系统、设备、存储介质,用于解决现有技术无法根据口酸进行快速疾病辅助诊断问题。本专利技术第一方面,公开一种基于口酸的疾病辅助诊断系统,所述系统包括:样本获取模块:从病例库中获取以口酸为第一主诉症状的病例,提取病例症状信息及对应的疾病名称,构建向量化的病例样本;样本标记模块:根据病例样本的疾病的发病原因,将口酸分为胃酸过多、肝火旺盛、消化不良几个大类,对病例样本标记;模型构建模块:通过Adaboost算法构建疾病分类模型,通过所述病例样本训练所述疾病分类模型;辅助诊断模块:获取待诊断病例的症状信息并进行向量化表示,通过训练好的疾病分类模型进行病例第一次分类,通过计算语义相似度的方式进行病例第二次分类,将第二次分类结果作为辅助诊断结果。优选的,所述样本获取模块和辅助诊断模块中,基于TextRank算法进行关键词提取,分别对病例样本和待诊断病例进行向量化表示,其具体过程包括:对病例的症状描述信息进行分词、去停用词处理,得到候选关键词,构建构建候选关键词图G=(V,E),其中V为节点集,E为边集合,任两点Vi,Vj之间边的权重为ωji,点Vi的得分定义如下:In(Vi)为指向点Vi的点集合,Out(Vi)为点Vi指向的点集合,d阻尼系数,取值范围为0到1,根据以上公式进行权重迭代,直至收敛。优选的,所述样本标记模块中,将胃酸过多、肝火旺盛、消化不良几个大类作为样本的第一标记,将每个样本对应的疾病名称作为第二标记。优选的,所述模型构建模块中,预先统计样本标记模块中各类第一标记对应的样本量,设定样本量阈值,将样本量超过所述阈值的作为多数类样本,其余为少数类样本;对于多数类样本,通过欧式距离法计算各类别中心点,筛选出与所述类别中心点在预设距离范围内的样本,使筛选出的样本与少数类样本均衡,筛选出的样本与少数类样本共同组成样本集。优选的,所述模型构建模块中,采用决策树模型作为疾病分类模型的基分类器。优选的,所述辅助诊断模块中,所述通过计算语义相似度的方式进行病例第二次分类具体为:根据病例第一次分类结果,获取第一标签下各个第二标签对应的疾病症状信息,计算待诊断病例的症状信息的特征向量与第二标签对应的疾病症状信息特征向量之间的语义相似度,取语义相似度最高的第二标签作为辅助诊断结果。本专利技术第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本专利技术第一方面所述的系统。本专利技术第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现权利要求1~6任一项所述的系统。本专利技术相对于现有技术具有以下有益效果:本专利技术通过Adaboost算法构建疾病分类模型,实现了以口酸为第一主诉症状的快速疾病辅助诊断,通过Adaboost算法构建疾病分类模型并进行初步分类,再根据初步分类结果根据语义相似度进行二次分类,可以比较准确地推导和预测出可能的疾病和健康问题,是一种简单实用的辅助诊断系统。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于口酸的疾病辅助诊断系统的结构示意图。具体实施方式下面将结合本专利技术实施方式,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。如图1所示,本专利技术第一方面,公开一种基于口酸的疾病辅助诊断系统,所述系统包括:样本获取模块100、样本标记模块200、模型构建模块300、辅助诊断模块400。样本获取模块100,从病例库中获取以口酸为第一主诉症状的病例,提取病例症状信息及对应的疾病名称,构建向量化的病例样本;口酸指病人自觉口中有酸味,或泛酸,甚至闻之有酸腐气味的症状,可伴见恶心、呕吐、胸闷胁痛、腹胀、苔黄、脉弦等症状;比如,胃炎表现为上腹部不适、反酸、烧心、打嗝、嗳气、恶心、呕吐、腹胀等症状;肝胃不合型症状有:口中发酸,嘈杂吞酸,食少纳呆,嗳气,胁肋胀痛,舌淡苔薄脉弦;宿食停滞型临床表现:主要表现为口中发酸,或嗳气酸腐,纳呆恶食,脘腹胀满,舌淡苔厚浊腻,脉滑等。样本标记模块200,根据病例样本的疾病的发病原因,将口酸分为胃酸过多、肝火旺盛、消化不良几个大类,对病例样本标记;具体的,将胃酸过多、肝火旺盛、消化不良几个大类作为样本的第一标记,将每个样本对应的疾病名称作为第二标记。模型构建模块300,通过Adaboost算法构建疾病分类模型,通过所述病例样本训练所述疾病分类模型;Adaboost的目的就是从训练数据中学习一系列弱分类器或基本分类器,然后将这些弱分类器组合成一个强分类器。可采用决策树模型作为疾病分类模型的基分类器。预先统计样本标记模块中各类第一标记对应的样本量,设定样本量阈值,将样本量超过所述阈值的作为多数类样本,其余为少数类样本;对于多数类样本,通过欧式距离法计算各类别中心点,筛选出与所述类别中心点在预设距离范围内的样本,使筛选出的样本与少数类样本均衡,筛选出的样本与少数类样本共同组成样本集。辅助诊断模块400,获取待诊断病例的症状信息并进行向量化表示,通过训练好的疾病分类模型进行病例第一次分类,通过计算语义相似度的方式进行病例第二次分类,将第二次分类结果作为辅助诊断结果。所述样本获取模块100和辅助诊断模块400中,基于TextRank算法进本文档来自技高网...
【技术保护点】
1.一种基于口酸的疾病辅助诊断系统,其特征在于,所述系统包括:/n样本获取模块:从病例库中获取以口酸为第一主诉症状的病例,提取病例症状信息及对应的疾病名称,构建向量化的病例样本;/n样本标记模块:根据病例样本的疾病的发病原因,将口酸分为胃酸过多、肝火旺盛、消化不良几个大类,对病例样本标记;/n模型构建模块:通过Adaboost算法构建疾病分类模型,通过所述病例样本训练所述疾病分类模型;/n辅助诊断模块:获取待诊断病例的症状信息并进行向量化表示,通过训练好的疾病分类模型进行病例第一次分类,通过计算语义相似度的方式进行病例第二次分类,将第二次分类结果作为辅助诊断结果。/n
【技术特征摘要】
1.一种基于口酸的疾病辅助诊断系统,其特征在于,所述系统包括:
样本获取模块:从病例库中获取以口酸为第一主诉症状的病例,提取病例症状信息及对应的疾病名称,构建向量化的病例样本;
样本标记模块:根据病例样本的疾病的发病原因,将口酸分为胃酸过多、肝火旺盛、消化不良几个大类,对病例样本标记;
模型构建模块:通过Adaboost算法构建疾病分类模型,通过所述病例样本训练所述疾病分类模型;
辅助诊断模块:获取待诊断病例的症状信息并进行向量化表示,通过训练好的疾病分类模型进行病例第一次分类,通过计算语义相似度的方式进行病例第二次分类,将第二次分类结果作为辅助诊断结果。
2.根据权利要求1所述基于口酸的疾病辅助诊断系统,其特征在于,所述样本获取模块和辅助诊断模块中,基于TextRank算法进行关键词提取,分别对病例样本和待诊断病例进行向量化表示,其具体过程包括:
对病例的症状描述信息进行分词、去停用词处理,得到候选关键词,构建构建候选关键词图G=(V,E),其中V为节点集,E为边集合,任两点Vi,Vj之间边的权重为ωji,点Vi的得分定义如下:
In(Vi)为指向点Vi的点集合,Out(Vi)为点Vi指向的点集合,d阻尼系数,取值范围为0到1,根据以上公式进行权重迭代,直至收敛。
3.根据权利要求1所述基于口酸的疾病辅助诊断系统,其特征在于,所述样本标记模块中,将胃酸过多、肝火旺盛、消化不良几个大类作为样本的第一标记,将每个样本对应的疾病名称作...
【专利技术属性】
技术研发人员:杜登斌,杜小军,杜乐,
申请(专利权)人:吾征智能技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。