医疗数据的填充方法和装置制造方法及图纸

技术编号:32361541 阅读:19 留言:0更新日期:2022-02-20 03:29
本发明专利技术提供了医疗数据的填充方法和装置,包括:构建知识库模型和医疗病历模型,知识库模型包括多个医疗分类类别,医疗病历模型包括多个电子病历数据;将电子病历数据中的非结构化数据通过自然语言处理算法,得到第一结构化数据,第一结构化数据用于表征实体之间的关联关系;将医疗病历模型的字段按照医疗分类类别进行标记,得到每个文书的字段的标记结果;根据每个文书的字段的标记结果,对多个电子病历数据进行筛选,得到筛选后的电子病历数据;将筛选后的电子病历数据进行分类、合并症和并发症的去除处理,得到处理结果;将处理结果进行聚合统计,得到统计结果;将统计结果填充到知识库对应的字段中,将临床信息中的症状信息填充到知识库中。充到知识库中。充到知识库中。

【技术实现步骤摘要】
医疗数据的填充方法和装置


[0001]本专利技术涉及医疗
,尤其是涉及医疗数据的填充方法和装置。

技术介绍

[0002]知识库数据作为一种专业的数据,包括权威且正确的数据内容。目前的知识库数据,为了确保内容的精准,都是通过医学编辑进行人工编辑的,依赖于专业的医疗书籍和官网。另外,知识库数据和临床数据关联,也为知识库数据提供一些临床的数据支撑,更加丰富知识库数据的内容,目前这个也是需要大量的人工来干预进行核验和矫正,这样会非常耗时耗力。
[0003]自动填充包括两个阶段:筛选和填充。填充之前,对要使用填充的电子病历进行筛选,生产高质量的电子病历,才能用于高质量的填充;在填充时,要将并发症和合并症的相关数据去除掉,以免在填充时,出现无关数据的填充。
[0004]现在很多电子病历内容不是很全,由于病历流程很长,有很多环节和来源于很多的系统,所以经常会造成很多内容的缺失,对于不完整的病历,作为临床数据分析时,就会不是很全面,准确性也不高。例如:有病历是缺失了就诊科室的信息,科室是病历作为分类的重要信息字段,此字段缺失,造成实现不了病历的预分类。故需要对电子病历进行筛选,从而得到高质量的电子病历。
[0005]在一次就诊中,往往在治疗的过程中,会出现初始病引起的其他疾病和症状,也有可能一次性因为两种无关的病而进行就诊,那么电子病历中就会出现多种疾病的相关症状、检验和检查信息,这些属于干扰信息,不能够被填充到知识库中。因此,需要将并发症和合并症去掉。
[0006]而上述过程,需要大量的人工来干预进行核验和矫正,这样会非常耗时耗力。

技术实现思路

[0007]有鉴于此,本专利技术的目的在于提供医疗数据的填充方法和装置,知识库在进行填充时,可以进行自动化填充,减少医疗编辑人员的工作量。
[0008]第一方面,本专利技术实施例提供了医疗数据的填充方法,所述方法包括:
[0009]构建知识库模型和医疗病历模型,所述知识库模型包括多个医疗分类类别,所述医疗病历模型包括多个电子病历数据;
[0010]将所述电子病历数据中的非结构化数据通过自然语言处理算法,得到第一结构化数据,所述第一结构化数据用于表征实体之间的关联关系;
[0011]将所述医疗病历模型的字段按照所述医疗分类类别进行标记,得到每个文书的字段的标记结果;
[0012]根据所述每个文书的字段的标记结果,对多个所述电子病历数据进行筛选,得到筛选后的电子病历数据;
[0013]将所述筛选后的电子病历数据进行分类、合并症和并发症的去除处理,得到处理
结果;
[0014]将所述处理结果进行聚合统计,得到统计结果;
[0015]将所述统计结果填充到知识库对应的字段中,以及将临床信息中的症状信息填充到所述知识库中。
[0016]进一步的,所述根据所述每个文书的字段的标记结果,对多个所述电子病历数据进行筛选,得到筛选后的电子病历数据,包括:
[0017]对所述每个文书的字段的标记结果进行统计,得到所述每个文书的统计结果;其中,所述每个文书的统计结果包括所述每个文书中每个所述医疗分类类别的字段个数;
[0018]根据所述每个文书的统计结果,计算所述每个文书的权重;
[0019]根据所述每个文书的统计结果和所述每个文书的权重,计算第一病历权重;
[0020]将所述每个文书的统计结果按照所述医疗分类类别进行归类,得到归类结果;其中,所述归类结果包括每个所述医疗分类类别的所有字段;
[0021]将每个所述医疗分类类别的所有字段的值域通过聚类算法进行统计,得到每个所述医疗分类类别聚类后的值域;
[0022]根据每个所述医疗分类类别聚类后的值域,计算每个所述医疗分类类别中每个字段对应的权重;
[0023]根据每个所述医疗分类类别中每个字段对应的权重,计算所有所述医疗分类类别中所有字段的权重之和;
[0024]根据所述第一病历权重和所有所述医疗分类类别中所有字段的权重之和,计算第二病历权重;
[0025]根据所述第二病历权重对多个所述电子病历数据进行筛选,得到所述筛选后的电子病历数据。
[0026]进一步的,所述根据所述第二病历权重对多个所述电子病历数据进行筛选,得到所述筛选后的电子病历数据,包括:
[0027]根据所述第二病历权重将多个所述电子病历数据按照从大到小的顺序进行排列,得到所述筛选后的电子病历数据;
[0028]或者,
[0029]将所述第二病历权重与设定阈值进行比较;
[0030]如果所述第二病历权重大于所述设定阈值,则将当前的电子病历数据作为所述筛选后的电子病历数据。
[0031]进一步的,所述电子病历数据包括第二结构化数据,所述方法还包括:
[0032]将所述第二结构化数据按照所述医疗分类类别进行转化,得到所述医疗分类类别的字段。
[0033]进一步的,所述将所述筛选后的电子病历数据进行分类、合并症和并发症的去除处理,得到处理结果,包括:
[0034]根据就诊科室和诊断结果对所述筛选后的电子病历数据进行分类,得到分类后的电子病历数据;
[0035]根据所述就诊科室和所述诊断结果从所述知识库中获取并发症和合并症;
[0036]将所述分类后的电子病历数据中的所述并发症和所述合并症去除,得到所述处理
结果。
[0037]进一步的,所述根据所述每个文书的统计结果,计算所述每个文书的权重,包括:
[0038]根据下式计算所述每个文书的权重:
[0039]Wm=Nm/Nsum+1
[0040]Nsum=∑Nm(m=1,2,3
····
)
[0041]其中,Wm为所述每个文书的权重,Nm为所述每个文书的统计结果,Nsum为m个文书的所有字段之和。
[0042]进一步的,所述根据所述每个文书的统计结果和所述每个文书的权重,计算第一病历权重,包括:
[0043]根据下式计算所述第一病历权重:
[0044]docWeight=N1*W1+N2*W2+N3*W3
····
Nm*Wm
[0045]其中,docWeight为所述第一病历权重,N1为第一文书的统计结果,W1为所述第一文书的权重,N2为第二文书的统计结果,W2为所述第二文书的权重,N3为第三文书的统计结果,W3为所述第三文书的权重,Nm为第m文书的统计结果,Wm为所述第m文书的权重。
[0046]第二方面,本专利技术实施例提供了医疗数据的填充装置,所述装置包括:
[0047]构建单元,用于构建知识库模型和医疗病历模型,所述知识库模型包括多个医疗分类类别,所述医疗病历模型包括多个电子病历数据;
[0048]第一结构化数据获取单元,用于将所述电子病历数据中的非结构化数据通过自然语言处理算法,得到第一结构化数据,所述第一结构化数据用于表征实体之间的关联关系;
[0049]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗数据的填充方法,其特征在于,所述方法包括:构建知识库模型和医疗病历模型,所述知识库模型包括多个医疗分类类别,所述医疗病历模型包括多个电子病历数据;将所述电子病历数据中的非结构化数据通过自然语言处理算法,得到第一结构化数据,所述第一结构化数据用于表征实体之间的关联关系;将所述医疗病历模型的字段按照所述医疗分类类别进行标记,得到每个文书的字段的标记结果;根据所述每个文书的字段的标记结果,对多个所述电子病历数据进行筛选,得到筛选后的电子病历数据;将所述筛选后的电子病历数据进行分类、合并症和并发症的去除处理,得到处理结果;将所述处理结果进行聚合统计,得到统计结果;将所述统计结果填充到知识库对应的字段中,以及将临床信息中的症状信息填充到所述知识库中。2.根据权利要求1所述的医疗数据的填充方法,其特征在于,所述根据所述每个文书的字段的标记结果,对多个所述电子病历数据进行筛选,得到筛选后的电子病历数据,包括:对所述每个文书的字段的标记结果进行统计,得到所述每个文书的统计结果;其中,所述每个文书的统计结果包括所述每个文书中每个所述医疗分类类别的字段个数;根据所述每个文书的统计结果,计算所述每个文书的权重;根据所述每个文书的统计结果和所述每个文书的权重,计算第一病历权重;将所述每个文书的统计结果按照所述医疗分类类别进行归类,得到归类结果;其中,所述归类结果包括每个所述医疗分类类别的所有字段;将每个所述医疗分类类别的所有字段的值域通过聚类算法进行统计,得到每个所述医疗分类类别聚类后的值域;根据每个所述医疗分类类别聚类后的值域,计算每个所述医疗分类类别中每个字段对应的权重;根据每个所述医疗分类类别中每个字段对应的权重,计算所有所述医疗分类类别中所有字段的权重之和;根据所述第一病历权重和所有所述医疗分类类别中所有字段的权重之和,计算第二病历权重;根据所述第二病历权重对多个所述电子病历数据进行筛选,得到所述筛选后的电子病历数据。3.根据权利要求2所述的医疗数据的填充方法,其特征在于,所述根据所述第二病历权重对多个所述电子病历数据进行筛选,得到所述筛选后的电子病历数据,包括:根据所述第二病历权重将多个所述电子病历数据按照从大到小的顺序进行排列,得到所述筛选后的电子病历数据;或者,将所述第二病历权重与设定阈值进行比较;如果所述第二病历权重大于所述设定阈值,则将当前的电子病历数据作为所述筛选后的电子病历数据。
4.根据权利要求1所述的医疗数据的填充方法,其特征在于,所述电子病历数据包括第二结构化数据,所述方法还包括:将所述第二结构化数据按照所述医疗分类类别进行转化,得到所述医疗分类类别的字段。5.根据权利要求1所述的医疗数据的填充方法,其特征在...

【专利技术属性】
技术研发人员:任彩红胡可云陈联忠
申请(专利权)人:北京嘉和海森健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1