本发明专利技术提出了一种基于电子病历的肝病认知系统。包括:预处理模块,获取历史病历数据,提取肝病数据信息,对肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据;特征划分模块,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,并生成对应的肝病描述特征信息数据集;筛选模块,用于通过IV值分析方法对肝病描述特征信息数据集进行特征筛选,并生成对应特征表格,将该特征表格作为诊断系统模型;预测认知模块,用于获取待诊断肝病描述特征信息,利用诊断系统模型对待诊断肝病描述特征信息进行诊断认知。本发明专利技术通过IV值分析法来剔除肝病描述特征信息数据集中的冗余特征,提高特征分析的准确度,提高整个认知系统的稳定性。
【技术实现步骤摘要】
一种基于电子病历的肝病认知系统
本专利技术涉及计算机
,尤其涉及一种基于电子病历的肝病认知系统。
技术介绍
肝病是一种具有危害性大、流行性广泛、治愈率低、死亡率高等特点的传染病。常见的肝病有肝炎、肝硬化、肝脓肿、脂肪性肝病、酒精性肝病、原发性肝癌等。现有的肝病认知技术就是通过给定肝病患者的数据信息,然后通过数据分析技术对肝病患者的数据信息进行分析,得到肝病多项特征,然后通过分析方法对肝病多项特征进行分析,根据分析结果对肝病进行认知,但是由于只能从病历中获取患者的数据信息,所以数据信息样本量小,而且特征较多,从而会导致冗余特征较多,影响分析的精确度,降低认知结果的准确性。所以,亟需一种基于电子病历的肝病认知系统。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
有鉴于此,本专利技术提出了一种基于电子病历的肝病认知系统,旨在解决现有技术无法实现通过IV值分析法剔除患者数据信息中的冗余特征,提高特征分析的准确度以及稳定性的技术问题。本专利技术的技术方案是这样实现的:一方面,本专利技术提供了一种基于电子病历的肝病认知系统,所述基于电子病历的肝病认知系统包括:预处理模块,用于获取历史病历数据,从该历史病历数据中提取肝病数据信息,对所述肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据;特征划分模块,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,根据肝病描述特征信息生成对应的肝病描述特征信息数据集;筛选模块,用于通过IV值分析方法对肝病描述特征信息数据集进行特征筛选,筛选出最终肝病描述特征信息,根据该最终肝病描述特征信息生成对应特征表格,并将该特征表格作为诊断系统模型;预测认知模块,用于获取待诊断肝病病历数据,从该待诊断肝病病历数据中提取待诊断肝病描述特征信息,利用诊断系统模型对待诊断肝病描述特征信息进行诊断认知。在以上技术方案的基础上,优选的,预处理模块包括数据整理模块,用于获取历史病历数据,从该历史病历数据中提取肝病数据信息,设定预处理规则,所述预处理规则包括:数据完整性检测、数据填充以及数据删除,根据该预处理规则对肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据,并对待划分数据进行肝病类别标注,所述肝病类别包括:肝炎、肝硬化、肝脓肿以及肝损伤。在以上技术方案的基础上,优选的,特征划分模块包括数据扩充模块,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,并根据该特征信息获取相似肝病病历数据,从相似肝病病历数据中提取对应的相似肝病描述特征信息以及对应的肝病类别标注,将肝病描述特征信息以及相似肝病描述特征信息组合作为待聚类肝病描述特征信息数据集。在以上技术方案的基础上,优选的,特征划分模块包括聚类划分模块,用于通过K-means聚类算法按照不同肝病特征信息对待聚类肝病描述特征信息数据集进行聚类划分,获取至少一个肝病描述特征信息数据集。在以上技术方案的基础上,优选的,筛选模块包括模型构建模块,用于通过IV值分析方法对肝病描述特征信息数据集进行特征筛选,获取筛选后的肝病描述特征信息作为最终肝病描述特征信息,根据该最终肝病描述特征信息生成对应特征表格,并将该特征表格作为诊断系统模型。在以上技术方案的基础上,优选的,筛选模块包括IV值分析公式单元,包括:其中,n代表病历样本在该特征上分成的组数,pni表示该病历样本第i组数据中白样本占所有白样本的比例,pyi表示该病历样本第i组数据中黑样本占所有黑样本的比例。在以上技术方案的基础上,优选的,预测认知模块包括报告生成模块,用于获取待诊断肝病病历数据,从该待诊断肝病病历数据中提取待诊断肝病描述特征信息,利用诊断系统模型中的特征表格对待诊断肝病描述特征信息进行匹配,查找匹配成功的最终肝病描述特征信息对应的肝病类别,并生成对应的认知报告。更进一步优选的,所述基于电子病历的肝病认知设备包括:预处理单元,用于获取历史病历数据,从该历史病历数据中提取肝病数据信息,对所述肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据;特征划分单元,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,根据肝病描述特征信息生成对应的肝病描述特征信息数据集;筛选单元,用于通过IV值分析方法对肝病描述特征信息数据集进行特征筛选,筛选出最终肝病描述特征信息,根据该最终肝病描述特征信息生成对应特征表格,并将该特征表格作为诊断系统模型;预测认知单元,用于获取待诊断肝病病历数据,从该待诊断肝病病历数据中提取待诊断肝病描述特征信息,利用诊断系统模型对待诊断肝病描述特征信息进行诊断认知。本专利技术的一种基于电子病历的肝病认知系统相对于现有技术具有以下有益效果:(1)通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,获取与肝病相关的关联症状,能够提高系统的认知准确度以及稳定性;(2)通过IV值分析方法对肝病描述特征信息数据集进行特征筛选,在样本量小、特征较多的情况下,剔除冗余特征、正确的选择特征会对模型整体的准确性和稳定性有着质的提升。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术基于电子病历的肝病认知系统第一实施例的结构框图;图2为本专利技术基于电子病历的肝病认知系统的第二实施例结构框图;图3为本专利技术基于电子病历的肝病认知系统的第三实施例结构框图;图4为本专利技术基于电子病历的肝病认知系统的第四实施例结构框图;图5为本专利技术基于电子病历的肝病认知系统的第五实施例结构框图;图6为本专利技术基于电子病历的肝病认知设备结构框图。具体实施方式下面将结合本专利技术实施方式,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。如图1所示,图1为本专利技术基于电子病历的肝病认知系统第一实施例的结构框图。其中,所述基于电子病历的肝病认知系统包括:预处理模块10、特征划分模块20、筛选模块30和预测认知模块40。预处理模块10,用于获取历史病历数据,从该历史病历数据中提取肝病数据信息,对所述肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据;特征划分模块20,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,根据肝病描述特征信息生成对应的肝病描述特征信息数据集;筛选模块30,用于通过IV值分析本文档来自技高网...
【技术保护点】
1.一种基于电子病历的肝病认知系统,其特征在于,所述基于电子病历的肝病认知系统包括:/n预处理模块,用于获取历史病历数据,从该历史病历数据中提取肝病数据信息,对所述肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据;/n特征划分模块,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,根据肝病描述特征信息生成对应的肝病描述特征信息数据集;/n筛选模块,用于通过IV值分析方法对肝病描述特征信息数据集进行特征筛选,筛选出最终肝病描述特征信息,根据该最终肝病描述特征信息生成对应特征表格,并将该特征表格作为诊断系统模型;/n预测认知模块,用于获取待诊断肝病病历数据,从该待诊断肝病病历数据中提取待诊断肝病描述特征信息,利用诊断系统模型对待诊断肝病描述特征信息进行诊断认知。/n
【技术特征摘要】
1.一种基于电子病历的肝病认知系统,其特征在于,所述基于电子病历的肝病认知系统包括:
预处理模块,用于获取历史病历数据,从该历史病历数据中提取肝病数据信息,对所述肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据;
特征划分模块,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,根据肝病描述特征信息生成对应的肝病描述特征信息数据集;
筛选模块,用于通过IV值分析方法对肝病描述特征信息数据集进行特征筛选,筛选出最终肝病描述特征信息,根据该最终肝病描述特征信息生成对应特征表格,并将该特征表格作为诊断系统模型;
预测认知模块,用于获取待诊断肝病病历数据,从该待诊断肝病病历数据中提取待诊断肝病描述特征信息,利用诊断系统模型对待诊断肝病描述特征信息进行诊断认知。
2.如权利要求1所述的基于电子病历的肝病认知系统,其特征在于:预处理模块包括数据整理模块,用于获取历史病历数据,从该历史病历数据中提取肝病数据信息,设定预处理规则,所述预处理规则包括:数据完整性检测、数据填充以及数据删除,根据该预处理规则对肝病数据信息进行预处理,获取预处理后的肝病数据信息作为待划分数据,并对待划分数据进行肝病类别标注,所述肝病类别包括:肝炎、肝硬化、肝脓肿以及肝损伤。
3.如权利要求2所述的基于电子病历的肝病认知系统,其特征在于:特征划分模块包括数据扩充模块,用于通过ICTCLAS分词工具从待划分数据中划分出肝病描述特征信息,并根据该特征信息获取相似肝病病历数据,从相似肝病病历数据中提取对应的相似肝病描述特征信息以及对应的肝病类别标注,将肝病描述特征信息以及相似肝病描述特征信息组合作为待聚类肝病描述特征信息数据集。
4.如权利要求3所述的基于电子病历的肝病认知系统,其特征在于:特征划分模块包括聚类划分模块,用于通过K-means聚类算法按照不同肝病特征信息对待聚类肝病描述特征信息数据集进行聚类划分,获取...
【专利技术属性】
技术研发人员:杜登斌,李宗博,杜小军,杜乐,
申请(专利权)人:吾征智能技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。