从电子病历中提取出ICD编码的方法及系统技术方案

技术编号:27940262 阅读:20 留言:0更新日期:2021-04-02 14:21
本发明专利技术公开了一种从电子病历中提取出ICD编码的方法及系统,该从电子病历中提取出ICD编码的方法包括:基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取,其中,所述医疗实体包括疾病诊断结果数据、检查数据、手术数据中的一个或多个;基于最小编辑距离算法确定出所述医疗实体所对应的ICD编码。本发明专利技术的从电子病历中提取出ICD编码的方法及系统能够快速提取出用于出院结算的ICD编码,帮助病人快速完成出院结算。

【技术实现步骤摘要】
从电子病历中提取出ICD编码的方法及系统
本专利技术是关于数据处理
,特别是关于一种从电子病历中提取出ICD编码的方法及系统。
技术介绍
ICD-9为手术用编码,ICD-10为疾病用编码。当前,国家为规范医疗行业电子病历,要求病历首页以ICD9和ICD10编码的方式反应病人在治疗过程中做过哪些检查,哪些手术并记录诊断结果。同时医保局将通过首页的编码记录进行报销。所以准确地提取病历中的诊断数据,检查数据以及手术数据(以下简称医疗实体)并对应到正确的ICD编码就变得尤为重要。目前大部医疗机构以人工的方式手工填写编码,工作人员需从几十页甚至上百页的电子病历中查找医疗实体,由于医生编写电子病历时的医疗实体并不完全符合编码对应的描述,可能会有错误,简写等情况,工作人员需要较高的知识储备才可进行一一对应。同时每天有大量病人出院结算,人工从电子病历中获取ICD编码的方式存在高技术门槛,工作量大以及大量重复工作等缺点。公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
本专利技术的目的在于提供一种从电子病历中提取出ICD编码的方法及系统,其能够快速提取出用于出院结算的ICD编码。为实现上述目的,本专利技术提供了一种从电子病历中提取出ICD编码的方法,其包括:基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取,其中,所述医疗实体包括疾病诊断结果数据、检查数据、手术数据中的一个或多个;基于最小编辑距离算法确定出所述医疗实体所对应的ICD编码。在本专利技术的一实施方式中,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:将所述电子病历中的病历小结的诊断结果中的逗号或分号后的数据作为医疗实体进行抽取;基于深度学习序列标注的算法从所述电子病历的其余数据中抽取医疗实体。在本专利技术的一实施方式中,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:若基于所述深度学习序列标注的算法得到的所述电子病历中的医疗实体前存在否定词,则对该医疗实体不作抽取。在本专利技术的一实施方式中,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:在通过深度学习序列标注的算法对医疗实体进行抽取时,在标注数据时对所述电子病历的病史段出现的医疗实体作区别标注,对区别标注的医疗实体不作抽取。在本专利技术的一实施方式中,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:若基于所述深度学习序列标注的算法得到的所述电子病历中的医疗实体为病史段的数据,则对该病史段的医疗实体不作抽取。在本专利技术的一实施方式中,所述基于最小编辑距离算法确定出所述医疗实体所对应的ICD编码包括:对抽取的每个医疗实体,基于最小编辑距离算法分别求取所述每个医疗实体与ICD编码之间的相似度,若某个医疗实体与某个ICD编码之间的相似度达到预设阈值,则将所述某个医疗实体的数值归一化为所述某个ICD编码。在本专利技术的一实施方式中,所述从电子病历中提取出ICD编码的方法还包括:在对电子病历中的医疗实体进行抽取之后,基于疾病诊断结果数据与检查数据以及手术数据之间的对应关系对抽取的医疗实体进行校对,剔除错误数据;和/或在基于最小编辑距离算法确定出所述医疗实体所对应的ICD编码之后,基于所述医疗实体的原始数据与所述ICD编码的对应关系,对所述ICD编码进行校对。基于同样的专利技术构思,本专利技术还提供了一种从电子病历中提取出ICD编码的系统,其包括:实体抽取模块以及ICD编码确定模块。实体抽取模块用于基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取,其中,所述医疗实体包括疾病诊断结果数据、检查数据、手术数据中的多个。ICD编码确定模块与所述实体抽取模块相耦合,用于基于最小编辑距离算法确定出所述医疗实体所对应的ICD编码。基于同样的专利技术构思,本专利技术还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一项所述的从电子病历中提取出ICD编码的方法的步骤。基于同样的专利技术构思,本专利技术还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一项所述的从电子病历中提取出ICD编码的方法的步骤。与现有技术相比,根据本专利技术的从电子病历中提取出ICD编码的方法及系统,针对非结构化的电子病历信息,基于序列标注算法以及预设规则对医疗实体进行自动化抽取,并且基于最小编辑距离算法确定医疗实体与ICD编码的相似度,从而在非结构化的数据快速准确抽取ICD编码信息并进行归一化处理,大幅降低了人工的工作量,可以帮助病人快速完成出院结算。附图说明图1是根据本专利技术一实施方式的从电子病历中提取出ICD编码的方法;图2是根据本专利技术一实施方式的从电子病历中提取出ICD编码的系统。具体实施方式下面结合附图,对本专利技术的具体实施方式进行详细描述,但应当理解本专利技术的保护范围并不受具体实施方式的限制。除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。为了能够快速地提取出从电子病历中提取出ICD编码,方便病人出院结算,一实施方式中提供了一种从电子病历中提取出ICD编码的方法,如图1所示,该方法包括:步骤S1~步骤S2。在步骤S1中,基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取,其中,所述医疗实体包括疾病诊断结果数据、检查数据、手术数据中的多个。具体而言,预设规则可以根据电子病历上的规律进行设定。如有些病例小结中‘诊断结果’后会以逗号或分号切分出患者做过哪些诊断。该种情况下,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:将所述电子病历中的病历小结的诊断结果中的逗号或分号后的数据作为医疗实体进行抽取;基于深度学习序列标注的算法从所述电子病历的其余数据中抽取医疗实体。由此,可以利用该规则进一步提高实体抽取的效率。再如,利用深度学习序列标注的算法识别出来的某些手术或检查在电子病历中的真实意思可能是患者拒绝做该手术或检查,对于该种情况,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:若基于所述深度学习序列标注的算法得到的所述电子病历中的医疗实体前存在否定词,则对该医疗实体不作抽取。再如,电子病历中的医疗实体可能是患者的病史数据,而不是本次检查结果,因而不能用于出院结算。对于该种情况,有两种处理方式可供选择。在第一种处理方式中,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:若基于所述深度学习序列标注的算法得到的所述电子病历中的医疗实本文档来自技高网...

【技术保护点】
1.一种从电子病历中提取出ICD编码的方法,其特征在于,包括:/n基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取,其中,所述医疗实体包括疾病诊断结果数据、检查数据、手术数据中的一个或多个;以及/n基于最小编辑距离算法确定出所述医疗实体所对应的ICD编码。/n

【技术特征摘要】
1.一种从电子病历中提取出ICD编码的方法,其特征在于,包括:
基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取,其中,所述医疗实体包括疾病诊断结果数据、检查数据、手术数据中的一个或多个;以及
基于最小编辑距离算法确定出所述医疗实体所对应的ICD编码。


2.如权利要求1所述的从电子病历中提取出ICD编码的方法,其特征在于,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:
将所述电子病历中的病历小结的诊断结果中的逗号或分号后的数据作为医疗实体进行抽取;
基于深度学习序列标注的算法从所述电子病历的其余数据中抽取医疗实体。


3.如权利要求1所述的从电子病历中提取出ICD编码的方法,其特征在于,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:
若基于所述深度学习序列标注的算法得到的所述电子病历中的医疗实体前存在否定词,则对该医疗实体不作抽取。


4.如权利要求1所述的从电子病历中提取出ICD编码的方法,其特征在于,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:
在通过深度学习序列标注的算法对医疗实体进行抽取时,在标注数据时对所述电子病历的病史段出现的医疗实体作区别标注,对区别标注的医疗实体不作抽取。


5.如权利要求1所述的从电子病历中提取出ICD编码的方法,其特征在于,所述基于深度学习序列标注的算法以及预设规则对电子病历中的医疗实体进行抽取包括:
若基于所述深度学习序列标注的算法得到的所述电子病历中的医疗实体为病史段的数据,则对该病史段的医疗实体不作抽取。


6.如权利要求1所...

【专利技术属性】
技术研发人员:李勃兴程国艮
申请(专利权)人:中译语通科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1