一种电子病历数据解析方法及系统技术方案

技术编号:39715547 阅读:15 留言:0更新日期:2023-12-17 23:23
本发明专利技术公开一种电子病历数据解析方法及系统,涉及数据处理领域,该方法包括:对于每一病历模版,根据病历模版中的标签名称提取目标电子病历数据中与标签名称相对应的数据项,得到每一病历模版对应的第一字符串,并将病历模版的标签名称进行组合,得到病历模版的第二字符串;计算第一字符串与第一字符串对应的第二字符串的差异值;将最小的差异值对应的病历模版作为最优解析模版;采用最优解析模版对目标电子病历数据进行解析,得到结构化数据

【技术实现步骤摘要】
一种电子病历数据解析方法及系统


[0001]本专利技术涉及数据处理
,特别是涉及一种电子病历数据解析方法及系统


技术介绍

[0002]区域内不同医疗机构不同承建厂家的电子病历数据格式

排版

内容等等都存在差异化,为了更好的开展临床诊断

治疗

预后的研究,需要对使用电子病历数据进行解析处理,目前,现有处理方法是对电子病历内容进行分词,但是分词的准确度依赖于选择医学词典知识库,后续还需要不断的进行更新,对电子病历内容分词意味着每条数据得到的内容都存在差异,因此在数据量大的情况下,分词的性能和速度也会比较慢,并且分词出的数据如何分类

数据如何直观的进行查阅

方便数据的挖掘和有效利用等等诸多问题都需要大量的研发量和人力成本

因此,亟需一种快速的

便捷的电子病历数据解析方法


技术实现思路

[0003]本专利技术的目的是提供一种更加快速的
...

【技术保护点】

【技术特征摘要】
1.
一种电子病历数据解析方法,其特征在于,所述方法包括:对于每一病历模版,根据所述病历模版中的标签名称提取目标电子病历数据中与所述标签名称相对应的数据项,得到每一所述病历模版对应的第一字符串,并将所述病历模版的标签名称进行组合,得到所述病历模版的第二字符串;所述病历模版由多个标签名称组成;所述标签名称为电子病历数据上的信息属性;一所述第一字符串对应一所述第二字符串;对于每一所述病历模版,计算所述病历模版对应的所述第一字符串与所述第一字符串对应的所述第二字符串的差异值;从所有所述差异值中选取最小的差异值,将最小的差异值对应的病历模版作为所述目标电子病历数据的最优解析模版;根据所述最优解析模版中的标签名称对所述目标电子病历数据进行解析,得到所述目标电子病历数据的结构化数据
。2.
根据权利要求1所述的电子病历数据解析方法,其特征在于,在所述根据所述病历模版中的标签名称提取目标电子病历数据中与所述标签名称相对应的数据项,得到每一所述病历模版对应的第一字符串之前,还包括:获取若干个电子病历数据;从若干个电子病历数据筛选出若干个病历模版,并提取每一所述病历模版中的标签名称
。3.
根据权利要求1所述的电子病历数据解析方法,其特征在于,所述提取每一所述电子病历数据的标签名称,具体包括:根据配置方法提取每一所述电子病历数据的标签名称;所述配置方法包括前后截取
、JSON
提取
、XML
提取和
/
或正则提取
。4.
根据权利要求1所述的电子病历数据解析方法,其特征在于,所述计...

【专利技术属性】
技术研发人员:李文强彭培军龚世文
申请(专利权)人:中电数据服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1