非标准疾病名称的疾病编码匹配方法、装置及计算机设备制造方法及图纸

技术编号:33207029 阅读:25 留言:0更新日期:2022-04-24 00:55
本申请公开了一种非标准疾病名称的疾病编码匹配方法、装置及计算机设备,涉及保险领域,可以解决非标准疾病名称无法匹配疾病编码导致的理赔效率低及理赔结果准确率低的问题。包括:基于预设标点符号切割疾病描述数据,得到疾病名称列表;在疾病名称列表中提取非标准疾病名称,基于编辑距离算法计算非标准疾病名称与标准疾病名称的第一特征相似度;按照第一特征相似度由大到小的顺序,在标准疾病库中筛选出预设数量个第一标准疾病名称;基于词频

【技术实现步骤摘要】
非标准疾病名称的疾病编码匹配方法、装置及计算机设备


[0001]本申请涉及保险领域,尤其涉及到一种非标准疾病名称的疾病编码匹配方法、装置及计算机设备。

技术介绍

[0002]国际疾病分类(International Classification of Diseases,ICD),是根据病因、部位、病理及临床表现对疾病进行分类,并用疾病编码表示的系统。在线上平台申请健康险等与疾病相关的理赔时,疾病编码是判断理赔风险与计算赔付金额的重要信息。但是由于不同医生存在不同的知识储备与书写习惯,同一疾病存在不同的疾病名称,使得人工录入或者光学字符识别(Optical Character Recognition,OCR)解析的疾病名称通常包括非标准疾病名称而无法与国际疾病分类(International Classification of Diseases,ICD)的疾病编码匹配。
[0003]目前在匹配非标准疾病名称与疾病编码时,往往需要专业人员参与进行对非标准疾病名称的纠正以及分类划分,然而此种方式对专业人员的知识储备要求较高,且工作量较大,导致处理效率较低且容易存在疏漏。

技术实现思路

[0004]有鉴于此,本申请提供了一种非标准疾病名称的疾病编码匹配方法、装置及设备,涉及保险领域,可以解决非标准疾病名称无法匹配疾病编码导致的理赔效率低及理赔结果准确率低的问题。
[0005]根据本申请的一个方面,提供了一种非标准疾病名称的疾病编码匹配方法,该方法包括:
[0006]获取疾病描述数据,并基于预设标点符号切割所述疾病描述数据,得到疾病名称列表,所述疾病名称列表中包括非标准疾病名称;
[0007]在所述疾病名称列表中提取所述非标准疾病名称,并基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的第一特征相似度;
[0008]按照所述第一特征相似度由大到小的顺序,在所述标准疾病库中筛选出预设数量个第一标准疾病名称;
[0009]基于词频

逆文件频率算法计算所述非标准疾病名称与所述第一标准疾病名称的第二特征相似度;
[0010]在所述第一标准疾病名称中提取对应所述第二特征相似度最大的第二标准疾病名称,将所述第二标准疾病名称对应的预设疾病编码确定为所述非标准疾病名称对应的目标疾病编码。
[0011]根据本申请的另一个方面,提供了一种非标准疾病名称的疾病编码匹配装置,该装置包括:
[0012]获取模块,用于获取疾病描述数据,并基于预设标点符号切割所述疾病描述数据,
得到疾病名称列表,所述疾病名称列表中包括非标准疾病名称;
[0013]第一计算模块,用于在所述疾病名称列表中提取所述非标准疾病名称,并基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的第一特征相似度;
[0014]筛选模块,用于按照所述第一特征相似度由大到小的顺序,在所述标准疾病库中筛选出预设数量个第一标准疾病名称;
[0015]第二计算模块,用于基于词频

逆文件频率算法计算所述非标准疾病名称与所述第一标准疾病名称的第二特征相似度;
[0016]确定模块,用于在所述第一标准疾病名称中提取对应所述第二特征相似度最大的第二标准疾病名称,将所述第二标准疾病名称对应的预设疾病编码确定为所述非标准疾病名称对应的目标疾病编码。
[0017]根据本申请的又一个方面,提供了一种非易失性可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述非标准疾病名称的疾病编码匹配方法。
[0018]根据本申请的再一个方面,提供了一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述非标准疾病名称的疾病编码匹配方法。
[0019]借由上述技术方案,本申请公开了一种非标准疾病名称的疾病编码匹配方法、装置及计算机设备,本申请可首先获取疾病描述数据,并基于预设标点符号切割疾病描述数据,得到疾病名称列表,疾病名称列表中包括非标准疾病名称;在疾病名称列表中提取非标准疾病名称,并基于编辑距离算法计算非标准疾病名称与标准疾病库中任一标准疾病名称的第一特征相似度;进一步的,按照第一特征相似度由大到小的顺序,在标准疾病库中筛选出预设数量个第一标准疾病名称;基于词频

逆文件频率算法计算非标准疾病名称与第一标准疾病名称的第二特征相似度;最后,在第一标准疾病名称中提取对应第二特征相似度最大的第二标准疾病名称,将第二标准疾病名称对应的预设疾病编码确定为非标准疾病名称对应的目标疾病编码。通过本申请中的技术方案,通过编辑距离算法与词频

逆文件频率算法相结合综合筛选出与非标准疾病名称匹配的目标疾病编码,提高了智能理赔的效率与理赔结果的准确性。
[0020]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0021]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本地申请的不当限定。在附图中:
[0022]图1示出了本申请实施例提供的一种非标准疾病名称的疾病编码匹配方法的流程示意图;
[0023]图2示出了本申请实施例提供的另一种非标准疾病名称的疾病编码匹配方法的流程示意图;
[0024]图3示出了本申请实施例提供的一种非标准疾病名称的疾病编码匹配的原理示意
图;
[0025]图4示出了本申请实施例提供的一种非标准疾病名称的疾病编码匹配装置的结构示意图;
[0026]图5示出了本申请实施例提供的另一种非标准疾病名称的疾病编码匹配装置的结构示意图。
具体实施方式
[0027]下文将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。
[0028]针对目前的问题,本申请实施例提供了一种非标准疾病名称的疾病编码匹配方法,如图1所示,该方法包括:
[0029]101、获取疾病描述数据,并基于预设标点符号切割疾病描述数据,得到疾病名称列表,疾病名称列表中包括非标准疾病名称。
[0030]对于本实施例,作为一种优选实施方式,疾病描述数据可以来源于病历、诊断书等,包含了对于病情的描述,在获取到疾病描述数据后,基于预设标点符号切割疾病描述数据,以从疾病描述数据中获得疾病名称,并构建包括疾病名称的疾病名称列表。其中,预设标点符号包括“,”、“;”、“、”、“/”等,每个预设标点符号对疾病描述数据进行切割时对应一个唯一含义,例如,标点符号“;”代表其前后相连的语句具有并列关系,即前后相连的语句具有至少两个对疾病名称的描述,标点符号“、”代本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种非标准疾病名称的疾病编码匹配方法,其特征在于,包括:获取疾病描述数据,并基于预设标点符号切割所述疾病描述数据,得到疾病名称列表,所述疾病名称列表中包括非标准疾病名称;在所述疾病名称列表中提取所述非标准疾病名称,并基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的第一特征相似度;按照所述第一特征相似度由大到小的顺序,在所述标准疾病库中筛选出预设数量个第一标准疾病名称;基于词频

逆文件频率算法计算所述非标准疾病名称与所述第一标准疾病名称的第二特征相似度;在所述第一标准疾病名称中提取对应所述第二特征相似度最大的第二标准疾病名称,将所述第二标准疾病名称对应的预设疾病编码确定为所述非标准疾病名称对应的目标疾病编码。2.根据权利要求1所述的方法,其特征在于,所述基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的第一特征相似度,包括:基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的编辑距离;基于所述编辑距离以及预设的相似度计算公式计算所述第一特征相似度。3.根据权利要求1所述的方法,其特征在于,所述基于词频

逆文件频率算法计算所述非标准疾病名称与所述第一标准疾病名称的第二特征相似度,包括:基于所述词频

逆文件频率算法计算所述非标准疾病名称的第一词频向量,以及所述第一标准疾病名称的第二词频向量;计算所述第一词频向量与所述第二词频向量的余弦距离,并将所述余弦距离确定为所述第二特征相似度。4.根据权利要求3所述的方法,其特征在于,所述基于所述词频

逆文件频率算法计算所述非标准疾病名称的第一词频向量,以及所述第一标准疾病名称的第二词频向量,包括:对所述非标准疾病名称和所述第一标准疾病名称分别进行分词处理,得到所述非标准疾病名称对应的第一词序列和所述第一标准疾病名称对应的第二词序列;基于TF

IDF算法计算所述第一词序列中各个第一词语对应标准疾病名称分词库的第一词频,利用所述第一词序列以及所述第一词频构建第一词频向量;基于TF

IDF算法计算所述第二词序列中各个第二词语对应标准疾病名称分词库的第二词频,利用所述第二词序列以及所述第二词频构建第二词频向量。5.根据权利要求1所述的方法,其特征在于,所述在所述疾病名称列表中提取非标准疾病名称,包括...

【专利技术属性】
技术研发人员:赵栋
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1