非标准疾病名称的疾病编码匹配方法、装置及计算机设备制造方法及图纸

技术编号:33207029 阅读:30 留言:0更新日期:2022-04-24 00:55
本申请公开了一种非标准疾病名称的疾病编码匹配方法、装置及计算机设备,涉及保险领域,可以解决非标准疾病名称无法匹配疾病编码导致的理赔效率低及理赔结果准确率低的问题。包括:基于预设标点符号切割疾病描述数据,得到疾病名称列表;在疾病名称列表中提取非标准疾病名称,基于编辑距离算法计算非标准疾病名称与标准疾病名称的第一特征相似度;按照第一特征相似度由大到小的顺序,在标准疾病库中筛选出预设数量个第一标准疾病名称;基于词频

【技术实现步骤摘要】
非标准疾病名称的疾病编码匹配方法、装置及计算机设备


[0001]本申请涉及保险领域,尤其涉及到一种非标准疾病名称的疾病编码匹配方法、装置及计算机设备。

技术介绍

[0002]国际疾病分类(International Classification of Diseases,ICD),是根据病因、部位、病理及临床表现对疾病进行分类,并用疾病编码表示的系统。在线上平台申请健康险等与疾病相关的理赔时,疾病编码是判断理赔风险与计算赔付金额的重要信息。但是由于不同医生存在不同的知识储备与书写习惯,同一疾病存在不同的疾病名称,使得人工录入或者光学字符识别(Optical Character Recognition,OCR)解析的疾病名称通常包括非标准疾病名称而无法与国际疾病分类(International Classification of Diseases,ICD)的疾病编码匹配。
[0003]目前在匹配非标准疾病名称与疾病编码时,往往需要专业人员参与进行对非标准疾病名称的纠正以及分类划分,然而此种方式对专业人员的知识储备要求较高,且工作量较大,导致本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种非标准疾病名称的疾病编码匹配方法,其特征在于,包括:获取疾病描述数据,并基于预设标点符号切割所述疾病描述数据,得到疾病名称列表,所述疾病名称列表中包括非标准疾病名称;在所述疾病名称列表中提取所述非标准疾病名称,并基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的第一特征相似度;按照所述第一特征相似度由大到小的顺序,在所述标准疾病库中筛选出预设数量个第一标准疾病名称;基于词频

逆文件频率算法计算所述非标准疾病名称与所述第一标准疾病名称的第二特征相似度;在所述第一标准疾病名称中提取对应所述第二特征相似度最大的第二标准疾病名称,将所述第二标准疾病名称对应的预设疾病编码确定为所述非标准疾病名称对应的目标疾病编码。2.根据权利要求1所述的方法,其特征在于,所述基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的第一特征相似度,包括:基于编辑距离算法计算所述非标准疾病名称与标准疾病库中任一标准疾病名称的编辑距离;基于所述编辑距离以及预设的相似度计算公式计算所述第一特征相似度。3.根据权利要求1所述的方法,其特征在于,所述基于词频

逆文件频率算法计算所述非标准疾病名称与所述第一标准疾病名称的第二特征相似度,包括:基于所述词频

逆文件频率算法计算所述非标准疾病名称的第一词频向量,以及所述第一标准疾病名称的第二词频向量;计算所述第一词频向量与所述第二词频向量的余弦距离,并将所述余弦距离确定为所述第二特征相似度。4.根据权利要求3所述的方法,其特征在于,所述基于所述词频

逆文件频率算法计算所述非标准疾病名称的第一词频向量,以及所述第一标准疾病名称的第二词频向量,包括:对所述非标准疾病名称和所述第一标准疾病名称分别进行分词处理,得到所述非标准疾病名称对应的第一词序列和所述第一标准疾病名称对应的第二词序列;基于TF

IDF算法计算所述第一词序列中各个第一词语对应标准疾病名称分词库的第一词频,利用所述第一词序列以及所述第一词频构建第一词频向量;基于TF

IDF算法计算所述第二词序列中各个第二词语对应标准疾病名称分词库的第二词频,利用所述第二词序列以及所述第二词频构建第二词频向量。5.根据权利要求1所述的方法,其特征在于,所述在所述疾病名称列表中提取非标准疾病名称,包括...

【专利技术属性】
技术研发人员:赵栋
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1