一种电子病历关键实体标准化识别方法及识别系统技术方案

技术编号:25693369 阅读:18 留言:0更新日期:2020-09-18 21:04
本发明专利技术公开一种电子病历关键实体标准化识别方法,包括:S1:定义电子病历关键实体,并建立电子病历关键实体数据库T(T

【技术实现步骤摘要】
一种电子病历关键实体标准化识别方法及识别系统
本专利技术属于医疗数据信息处理领域,具体涉及一种电子病历关键实体标准化识别方法及识别系统。
技术介绍
电子病历系统应用水平分级评价标准是近几年国家卫生健康委员会医政医管局在大力推进的一项重点工作,从电子病历系统功能实现程度、电子病历应用范围推广范围和电子病历数据质量高低等三个维度进行评价,较高的评价标准对各级医疗机构电子病历提出了严峻的挑战。基于电子病历的数据利用、数据上报和数据分析是当前各级医疗机构医疗质量和安全管理的重要任务。但是,由于缺乏电子病历系统建设的标准化和电子病历的使用规范性,导致各级医疗机构在建设电子病历系统的过程中没有标准可以参照,电子病历系统在使用过程中医护人员的数据填报结构化和标准化水平较低,电子病历系统的历史数据可重复利用率较低。因此,电子病历的标准化工作势在必行。目前,绝大部分医疗机构通过电子病历结构化和电子病历后结构化方式在开展电子病历的标准化工作。但是,电子病历结构化可高可低,如果结构化程度很低,数据的利用率将会受到很大的影响,如果结构化程度很高,医护人员在填报电子病历数据时将耗费大量的时间和精力。因此,电子病历关键实体标准化显得极其重要。所谓电子病历关键实体,是指电子病历系统中医学相关的重要名称字段,如诊断名称、手术名称等。现有技术中,电子病历关键实体缺乏标准化对照字典或者各级医疗机构在用字典编码不统一导致数据难以共享和引用;电子病历结构化程度普遍不高,大量的信息需要依靠医护人员手工完整录入,花费大量的工作时间;现有自然语言处理技术不足于很好的支撑电子病历数据的后结构化,电子病历后结构化正确性有待提升;现绝大部分电子病历实体标准化采用的字符串通配符匹配方式的正确性和效率不高,甚至会出现不符合通配规则导致不能正确显示的问题。因此,有必要设计一种电子病历关键实体标准化识别方法,对电子病历的关键实体进行标准化,降低人工输入的难度和误差,提高电子病历数据的质量和利用率。
技术实现思路
为了解决上述问题,本专利技术提供了一种电子病历关键实体标准化识别方法及识别系统,对电子病历的关键实体进行标准化,降低人工输入的难度和误差,提高电子病历数据的质量和利用率。为此,本专利技术采用如下技术方案:一种电子病历关键实体标准化识别方法,包括以下步骤:S1:定义电子病历关键实体,并建立电子病历关键实体数据库T(T1,T2,T3…….Tk);S2:建立标准化字典库P(P1,P2,P3…….Pm);S3:当操作端输入电子病历关键实体数据Tk时,进行相似度运算,匹配标准化字典库P中的相似数据,并按照相似度百分比从高到低进行排序,并给出选择提示输出到操作端;S4:操作端根据选择提示输入经标准化的电子病历关键实体数据。本专利技术通过在电子病历录入时,当输入关键实体数据时提供字典的高度匹配,将相似度百分比最高的排在最前面,提示给操作者,实现电子病历关键实体数据的标准化,大大地减少了输入过程中的人为差错和各种不规范、差异化,大大降低了操作者进行标准化输入的难度,节约了操作时间,为电子病历系统结构化存储和标准化利用的提供了基础。进一步地,在步骤S3中,所述相似度运算采用编辑距离算法,具体包括如下步骤:S3-0:操作端输入电子病历关键实体数据Tk,记为字符串str1,设置n为字符串str1的长度;S3-1:按照字符串str1的输入顺序,从标准化字典库P分别提取出每个字典项或者该字典项的直接拼音字母,记为字符串str2,设置m为字符串str2的长度;构造两个向量v0[m+1]和v1[m+1],串联0..m之间所有的元素;S3-2:初始化v0to0..m;S3-3:检查str1(ifrom1ton)中的每个字符;S3-4:检查str2(jfrom1tom)中的每个字符;S3-5:如果str1[i]等于str2[j],则编辑代价cost为0;如果str1[i]不等于str2[j],则编辑代价cost为1;S3-6:设置单元v1[j]为下面的最小值之一:a、紧邻该单元上方+1:v1[j-1]+1b、紧邻该单元左侧+1:v0[j]+1c、该单元左斜对角+cost:v0[j-1]+costS3-7:依次完成步骤S3-3至步骤S3-6迭代后,v1[m]便是编辑距离num的值;S3-8:根据下述公式计算出相似度百分比:1-num/(double)Math.max(str1.length(),str2.length()))X100%。进一步地,在步骤S3中,如果输入的电子病历关键实体数据Tk是中文,则按照GB2312编码规则转换为拼音字母,如果输入的是拼音字母则保持不变。关键实体输入也可以采用中文输入大大提高了输入效率,因为输入的中文可以按照程序设置的编码规则自动转换为拼音字母。进一步地,在步骤S3中,每输入一个中文或者拼音字母就进行一次相似度运算,并实时排序一次,相似度百分比越高越排前。供电子病历操作人员比较直观的看到并且能够较容易的选择相似度比较靠前的选项,做到电子病历关键实体标准化识别采用每次输入均运算一次的方式大大减少了程序在进行复杂运算时的出错率,也减少了程序等待时间。本专利技术的另一方面,还公开了一种采用了上述电子病历关键实体标准化识别方法的标准化识别系统,包括:输入端,输出端,以及存储和运算电子病历关键实体数据库T和标准化字典库P的数据处理平台,所述数据处理平台识别并接受输入端输入的数据Tk,进行相似度运算,匹配标准化字典库P中的数据,输出至输出端,共操作者选择。同一所属区域或者部门可以同时在不同的输入终端采用此种标准化识别方法,从而形成电子病历关键实体标准化识别系统,在系统内采用统一的关键实体识别标准。本专利技术不仅可以使用在同一部门的不同终端,也可以使用在不同部门的不同终端,如医院门诊部门,医疗研究机构等,从而大大节约了资源,提高了数据共享的效率。与现有技术相比,本专利技术具有如下有益效果:1)、因为采用标准化字典库,通过编辑距离算法实现关键实体输入部分与标准字典库项目的字符操作比较,按照相似度百分比从高到低给出选择提示,可以实现操作人员在电子病历关键实体数据输入时的标准化匹配和选择性录入,减少了错误率和各种差异化输入,为电子病历关键实体的完全结构化标准化奠定了基础,更利于电子病历数据的结构化存储和后期的重复利用。2)、本专利技术采用输入中文和汉语拼音的方式进行前期录入,方便不同文化专业背景和各层次的操作人员进行输入操作,无论中文和拼音均简单易行方便识别,从而大大降低了对操作人员的技术背景要求。3)、本专利技术的电子病历关键实体标准化识别方法及标准化识别系统,方便整体电子病历的系统性共享和大数据分析比对,不仅可以使用在同一医院,也可以使用在政府部分或者不同领域的部门之间,大大提高了数据的使用效率,也提高了所属行业的工作效率。附图说明图1为本专利技术中的编辑距离本文档来自技高网
...

【技术保护点】
1.一种电子病历关键实体标准化识别方法,包括以下步骤:/nS1:定义电子病历关键实体,并建立电子病历关键实体数据库T(T

【技术特征摘要】
1.一种电子病历关键实体标准化识别方法,包括以下步骤:
S1:定义电子病历关键实体,并建立电子病历关键实体数据库T(T1,T2,T3…….Tk);
S2:建立标准化字典库P(P1,P2,P3…….Pm);
S3:当操作端输入电子病历关键实体数据Tk时,进行相似度运算,匹配标准化字典库P中的相似数据,并按照相似度百分比从高到低进行排序,并给出选择提示输出到操作端;
S4:操作端根据选择提示输入经标准化的电子病历关键实体数据。


2.根据权利要求1所述的电子病历关键实体标准化识别方法,其特征在于:在步骤S3中,所述相似度运算采用编辑距离算法,具体包括如下步骤:
S3-0:操作端输入电子病历关键实体数据Tk,记为字符串str1,设置n为字符串str1的长度;
S3-1:按照字符串str1的输入顺序,从标准化字典库P分别提取出每个字典项或者该字典项的直接拼音字母,记为字符串str2,设置m为字符串str2的长度;构造两个向量v0[m+1]和v1[m+1],串联0..m之间所有的元素;
S3-2:初始化v0to0..m;
S3-3:检查str1(ifrom1ton)中的每个字符;
S3-4:检查str2(jfrom1tom)中的每个字符;
S3-5:如果str1[i]等于str2[j],则编辑代价cost为0;如果str1[i]不等于str2[j],则编辑代价...

【专利技术属性】
技术研发人员:沈玉强季婧屈依波周庆利刘建林唐杰
申请(专利权)人:浙江大学医学院附属第四医院浙江省义乌医院浙江大学医学院附属第四医院医共体
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1