The present invention relates to a method of visual report based on medical documents. The method of the invention includes the following steps: 1) collecting the data of medical documents; 2) dividing the data of medical documents into disease data and patient data; 3) analyzing the data of disease category, adopting clustering algorithm, and presenting the results of analysis by means of disease category distribution map; 4) analyzing the data of disease population, adopting population attribute labeling algorithm and association rules. Mining algorithm, and then use the method of network graph of disease population to present the results of analysis; among them, the disease category data analysis adopts clustering algorithm; the data analysis of disease population uses Apriori algorithm to do association rule mining. In view of the specificity of large medical data, the present invention proposes a solution for the analysis of these different dimensions in a unified manner, which is convenient for disease prevention and control.
【技术实现步骤摘要】
基于医疗单据的可视化报表的方法和系统
本专利技术属于数据或信息处理
,具体涉及医疗大数据的处理,更具体涉及医疗单据的可视化报表的方法和系统。
技术介绍
在医疗行业,医疗数据有医院的具体诊疗数据,这类数据一般专业性高,而且主要在医院各科室存储所以普通渠道不易获取。但是医疗单据数据(发票、处方等),由于全部要交给患者持有,所以采集容易,比如保险公司理赔渠道都能获取这类数据。因此,这类医疗单据数据正在呈几何级数的增长。随之而来的问题是:医疗单据大数据可视化系统的极度匮乏。因为面对海量数据的时候,逐条浏览数据变得没有任何意义。需要可视化系统来生成。而对于可视化系统来说,不同的行业的数据以及数据维度,会带来最终报表呈现上的天壤之别。随着现在大数据概念的兴起,各行各业开始高度重视本行业各类数据的采集和存储。已知的大数据分析已有一定的应用,如申请号为201610497249的专利申请涉及基于大数据分析建立疾病云图的方法,申请号为201710150587.8的专利申请涉及智慧环保大数据可视化方法。但是医疗大数据具有其特定性,比如涉及有疾病,疾病类别,患者有年龄、性别等属性。如何将这些不同的维度,以统一的方式呈现出来便于疾病防控的分析,是一个需要解决的问题。
技术实现思路
针对上述需求,本专利技术提供一种基于医疗单据的可视化报表的方法。本专利技术的一种基于医疗单据的可视化报表的方法,主要包括下述流程:1)采集医疗单据的数据2)将医疗单据的数据分为疾病数据和患者数据3)对疾病类别数据进行分析,采用聚类算法,然后用疾病类别分布图谱的方式来呈现分析的结果4)对疾病人群的数据进行 ...
【技术保护点】
1.一种基于医疗单据的可视化报表的方法,其特征在于,包括如下步骤:1)采集医疗单据的数据;2)将医疗单据的数据分为疾病数据和患者数据;3)对疾病类别数据进行分析,采用聚类算法,然后用疾病类别分布图谱的方式来呈现分析的结果;4)对疾病人群的数据进行分析,采用人群属性标签算法和关联规则挖掘算法,然后用疾病人群的网络关系图的方法来呈现分析的结果;其中,所述疾病类别数据分析使用ICD10医疗目录,作为树状结构目录,然后将具体疾病在目录树上做聚类算法;所述对疾病人群的数据进行分析是用疾病和患者两方面的数据做关联规则挖掘,其是采用Apriori算法做关联规则挖掘。
【技术特征摘要】
1.一种基于医疗单据的可视化报表的方法,其特征在于,包括如下步骤:1)采集医疗单据的数据;2)将医疗单据的数据分为疾病数据和患者数据;3)对疾病类别数据进行分析,采用聚类算法,然后用疾病类别分布图谱的方式来呈现分析的结果;4)对疾病人群的数据进行分析,采用人群属性标签算法和关联规则挖掘算法,然后用疾病人群的网络关系图的方法来呈现分析的结果;其中,所述疾病类别数据分析使用ICD10医疗目录,作为树状结构目录,然后将具体疾病在目录树上做聚类算法;所述对疾病人群的数据进行分析是用疾病和患者两方面的数据做关联规则挖掘,其是采用Apriori算法做关联规则挖掘。2.如权利要求1所述的方法,其特征在于,所述疾病类别数据分析的方法具体为:根据医疗单据上的处方和诊断证明中的疾病名称来获得疾病数据的来源;使用ICD10医疗目录,作为树状结构目录,然后将具体疾病目录树上做聚类算法,具体聚类算法过程为:A)以关系型数据方式整理出icd10目录,分DS1,DS2,DS3三个级别;B)以相似度查找的方法,同时加以纠错的方式定位到具体的疾病记录DS3,查找的具体方法,是遍历单据上疾病,计算它和DS3级别疾病的编辑距离;C)对DS3,记录病患的次数;D)在DS2级别上,汇总DS3级别的所有次数;在DS1级别上汇总DS2的所有数据。这样,无论哪一级数据都能得出病患次数;E)最终,能按树状结构汇总出疾病的发病次数和人数。3.如权利要求2所述的方法,其特征在于,第B)中的具体算法如下:B1)str1或str2的长度为0返回另一个字符串的长度:if(str1.length==0)returnB2)初始化(n+1)*(m+1)的矩阵d,并让第一行和列的值从0开始增长;扫描两字符串(n*m级的),如果:str1[i]==str2[j],用temp记录它,为0;否则temp记为1;然后在矩阵d[i,j]赋于d[i-1,j]+1、d[i,j-1]+1、d[i-1,j-1]+temp三者的最小值;B3)扫描完后,返回矩阵的最后一个值d[n][m]即是它们的距离;B4)和所有DS3级别比较距离,距离为0或低于一个阈值的,命中,可以认为单据上的疾病就是此DS3的疾病。4.如权利要求1所述的方法,其特征在于,所述疾病人群的数据进行分析的方...
【专利技术属性】
技术研发人员:孙字弋,
申请(专利权)人:北京众信易保科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。