基于法定诊断标准智能识别传染病的系统、设备及存储介质技术方案

技术编号:26037076 阅读:16 留言:0更新日期:2020-10-23 21:15
本发明专利技术公开一种基于法定诊断标准智能识别传染病的系统、设备及存储介质,所述系统包括:指标构建模块、信息提取模块、标准数据库、第一文本挖掘模块、第二文本挖掘模块和特征匹配模块;本发明专利技术基于传染病法定诊断标准确定传染病分类的具体指标,通过提取传染病病例分类标准和每一个传染病病例分类标准所包含的主要特征信息,建立了标准数据库;采用特征信息向量空间模型进行传染病诊断标准特征提取,通过余弦相似度、互信息相似度及其结合结合来进行智能识别,从而实现病例精准识别、智能认知和辅助诊断。

【技术实现步骤摘要】
基于法定诊断标准智能识别传染病的系统、设备及存储介质
本专利技术涉及传染病防治
,尤其涉及一种基于法定诊断标准智能识别传染病的系统、设备及存储介质。
技术介绍
传染病(InfectiousDiseases)是由各种病原体引起的能在人与人、动物与动物或人与动物之间相互传播的一类疾病。目前国家法定管理的传染病已由原来的37种增为39种。其中:甲类2种、乙类26种、丙类11种。甲类传染病包括鼠疫、霍乱等;乙类传染病包括传染性非典型肺炎、艾滋病、病毒性肝炎等;丙类传染病包括肺结核、血吸虫病、丝虫病、包虫病、麻风病、流行性感冒、流行性腮腺炎、风疹、新生儿破伤风、急性出血性结膜炎、除霍乱、痢疾、伤寒和副伤寒以外的感染性腹泻病等。法定传染病诊断标准主要参考《中华人民共和国传染病防治法》规定管理的传染病诊断标准(试行)目录。传统的法定传染病识别方法主要是发现或者采集到患者某些症状特征信息后,根据国家公布的诊断标准,如果发现符合或者基本符合法定诊断标准某一特征信息,进行人工进行比对、筛查,费时费力不说,有些模棱两可、似是而非的特征信息,有时让人无法判断或者做出正确的决定,往往会造成大量信息损失,从而导致漏报与错报。因此,需要一种基于法定诊断标准智能识别传染病的辅助诊断系统,来实现病例精准识别、智能认知和辅助诊断。
技术实现思路
有鉴于此,本专利技术提出了一种基于法定诊断标准智能识别传染病的系统,用于解决传统人工进行传染病比对筛查可能导致漏报与错报的问题,帮助医护工作人员进行传染病辅助诊断。本专利技术第一方面,提出一种基于法定诊断标准智能识别传染病的系统,所述系统包括:指标构建模块:用于根据法定传染病诊断标准绘制和构建法定传染病病例分类以及诊断标准的具体指标;信息提取模块:用于根据法定传染病病例分类以及诊断标准的具体指标,提取每一个传染病病例分类所包含的主要特征信息;标准数据库:用于建立各种传染病以及同一种传染病不同病例分类类型诊断标准与所对应的主要特征信息之间关联关系的标准数据库;第一文本挖掘模块:用于对所述标准数据库的主要特征信息进行文本挖掘,进行权重计算及第一核心特征词提取,构建向量空间模型,得到各个传染病病例分类的主要特征信息对应的第一特征向量集合;第二文本挖掘模块:用于构建基于条件互信息的特征选择模型,采用TF-IDF函数对所述标准数据库的主要特征信息进行文本挖掘,根据主要特征信息的词条和病例分类之间的相关度进行权值计算,并选取第二核心特征词,构建向量空间模型,得到各个传染病病例分类的主要特征信息对应的第二特征向量集合;特征匹配模块:用于分别计算待分类文本与所述第一特征向量集合中元素之间的余弦相似度;分别计算待分类文本与所述第二特征向量集合元素之间的互信息相关度;根据所述余弦相似度和互信息相关度对待分类文本进行病例分类。优选的,所述第一文本挖掘模块中,采用TF-IDF函数计算主要特征信息的词条权重:设D为一个包含m个文档的档集合,Di为第i个文档的特征向量,则有:D={D1,D2,…,Dm},Di=(di1,di2,…,din),i=1,2,…,m,其中dij为文档Di中第j个词条tj的权值:上式中i=1,2,…,m;j=1,2,…,n,N是文档数据库中文档总数,nj是文档数据库含有词条tj的文档数目。优选的,所述特征匹配模块模块中,所述根据主要特征信息的词条和病例分类之间的相关度进行权值计算,并选取第二核心特征词具体为:计算病例分类中包含的主要特征信息的各个词条和病例分类之间的互信息相关度,公式为:其中,A为在病例分类类别c中词条t出现的文档数;B为在除了病例分类类别c的其他类别中词条t出现的文档数;C为在病例分类类别c中词条t未出现的文档数;N为所有类别中的文档数的总和;如果共有m个类别则每个词条将得到m个相关度值;取所述m个值的平均值作为每个词条的权值,对词条按照词频从低到高排序,去除只在单个类别出现且词频低于预设词频阈值的词,对剩余词条按照权值从高到低排序,取权值高于预设权值阈值的词作为第二核心特征词。优选的,所述特征匹配模块模块中,所述根据所述余弦相似度和互信息相关度对待分类文本进行病例分类具体为:对于每一病例分类类别,取余弦相似度与互信息相关度中的最大值作为对应病例分类类别的输出概率值,设置第一概率阈值,取概率值大于所述第二概率阈值的类别作为识别推荐结果。优选的,所述特征匹配模块模块中,所述根据所述余弦相似度和互信息相关度对待分类文本进行病例分类具体为:对于每一病例分类类别,取余弦相似度与相关度的加权之和作为对应病例分类类别的输出概率值,设置第二概率阈值,取概率值大于所述第二概率阈值的类别作为识别推荐结果。本专利技术第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如本专利技术第一方面所述的系统。本专利技术第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本专利技术第一方面所述的系统。本专利技术的相对于现有技术具有以下有益效果:1)本专利技术基于现行的传染病法定诊断标准,建立了不同传染病以及同一种传染病不同病例分类类型诊断标准与所对应的主要特征信息之间关联关系的标准数据库,所述标准数据库为各类传染病及同一种传染病不同病例分类类型提供了全面的标准特征信息库,为各类传染病辅助诊断与准确识别提供了依据;2)基于所述标准数据库,本专利技术将向量空间模型应用到传染病诊断标准的特征提取之中,可以有效解决类型分类和特征信息提取这两个重要的问题,极大地减少特征信息损失,提高了智能识别与诊断的准确率;3)本专利技术分别通过余弦相似度、互信息相似度及其结合结合来进行智能识别,通过多方面交叉对比的方式进一步提高诊断准确率,为医护人员提供了可靠的辅助诊断结果,减少漏报与错报。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的系统结构示意图。具体实施方式下面将结合本专利技术实施方式,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。请参阅图1,本专利技术提出一种基于法定诊断标准智能识别传染病的系统,所述系统包括:指标构建模块:用于根据法定传染病诊断标准本文档来自技高网...

【技术保护点】
1.一种基于法定诊断标准智能识别传染病的系统,其特征在于,所述系统包括:/n指标构建模块:用于根据法定传染病诊断标准绘制和构建法定传染病病例分类以及诊断标准的具体指标;/n信息提取模块:用于根据法定传染病病例分类以及诊断标准的具体指标,提取每一个传染病病例分类所包含的主要特征信息;/n标准数据库:用于建立各种传染病以及同一种传染病不同病例分类类型诊断标准与所对应的主要特征信息之间关联关系的标准数据库;/n第一文本挖掘模块:用于对所述标准数据库的主要特征信息进行文本挖掘,采用TF-IDF函数进行权重计算及第一核心特征词提取,构建向量空间模型,得到各个传染病病例分类的主要特征信息对应的第一特征向量集合;/n第二文本挖掘模块:用于构建基于条件互信息的特征选择模型,对所述标准数据库的主要特征信息进行文本挖掘,根据主要特征信息的词条和病例分类之间的互信息相关度进行权值计算,并选取第二核心特征词,构建向量空间模型,得到各个传染病病例分类的主要特征信息对应的第二特征向量集合;/n特征匹配模块:用于分别计算待分类文本与所述第一特征向量集合中元素之间的余弦相似度;分别计算待分类文本与所述第二特征向量集合元素之间的互信息相关度;根据所述余弦相似度和互信息相关度对待分类文本进行病例分类。/n...

【技术特征摘要】
1.一种基于法定诊断标准智能识别传染病的系统,其特征在于,所述系统包括:
指标构建模块:用于根据法定传染病诊断标准绘制和构建法定传染病病例分类以及诊断标准的具体指标;
信息提取模块:用于根据法定传染病病例分类以及诊断标准的具体指标,提取每一个传染病病例分类所包含的主要特征信息;
标准数据库:用于建立各种传染病以及同一种传染病不同病例分类类型诊断标准与所对应的主要特征信息之间关联关系的标准数据库;
第一文本挖掘模块:用于对所述标准数据库的主要特征信息进行文本挖掘,采用TF-IDF函数进行权重计算及第一核心特征词提取,构建向量空间模型,得到各个传染病病例分类的主要特征信息对应的第一特征向量集合;
第二文本挖掘模块:用于构建基于条件互信息的特征选择模型,对所述标准数据库的主要特征信息进行文本挖掘,根据主要特征信息的词条和病例分类之间的互信息相关度进行权值计算,并选取第二核心特征词,构建向量空间模型,得到各个传染病病例分类的主要特征信息对应的第二特征向量集合;
特征匹配模块:用于分别计算待分类文本与所述第一特征向量集合中元素之间的余弦相似度;分别计算待分类文本与所述第二特征向量集合元素之间的互信息相关度;根据所述余弦相似度和互信息相关度对待分类文本进行病例分类。


2.根据权利要求1所述基于法定诊断标准智能识别传染病的系统,其特征在于,所述第一文本挖掘模块中,采用TF-IDF函数计算主要特征信息的词条权重:
设D为一个包含m个文档的档集合,Di为第i个文档的特征向量,则有:D={D1,D2,…,Dm},Di=(di1,di2,…,din),i=1,2,…,m,其中dij为文档Di中第j个词条tj的权值:



上式中i=1,2,…,m;j=1,2,…,n,N是标准数据库中文档总数,nj是标准数据库含有词条tj的文档数目。


3.根据权利要求1所述基于法定诊断标准智能识别传染病的系统,其特征在于,所述特征匹配模块模块中,所述根据主要特征信息的词条和病例分类之间...

【专利技术属性】
技术研发人员:杜乐
申请(专利权)人:武汉东湖大数据交易中心股份有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1