一种疾病编码转换的方法技术

技术编号:21658843 阅读:47 留言:0更新日期:2019-07-20 05:41
本发明专利技术涉及一种疾病编码转换的方法,包括以下步骤:S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库;S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;S03:根据所述标准字典库和所述测试集,形成术语向量;S04:提取需要进行转换的所述疾病编码的前N位编码值,获取初选疾病编码;S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。本发明专利技术的有益效果是:确保转换的疾病编码的准确度,实现各个版本疾病编码之间的转换。

A Method of Disease Coding Conversion

【技术实现步骤摘要】
一种疾病编码转换的方法
本专利技术涉及医学、计算机应用
,尤其涉及一种疾病编码转换的方法。
技术介绍
疾病和有关健康问题的国际统计分类(InternationalClassificationofdiseases,ICD),是WHO(WorldHealthOrganization,世界卫生组织)制定的国际统一的疾病分类方法,它根据疾病的病因、病理、临床表现和解剖位置等特性,将疾病分门别类,使其成为一个有序的组合,并用编码的方法来表示的系统,它是记录医学信息的载体,是开展医疗数据挖掘、疾病诊断分组以及绩效评价、医保DRG收付费的基础。在国内医疗机构实践中,各地根据临床疾病的特点对编码进行了不同的拓展,同时,对于相同疾病,也存在版本上的描述性差异。例如,GB-2016ICD-10版中,“A00.100霍乱,由于O1群霍乱弧菌,埃尔托生物型所致”,与BJ-V6.01版中的“A00.101埃尔托生物型霍乱”,两者在编码及术语描述上均存在差异;由此出现了多个版本不统一问题,严重影响着行业内的数据互联互通和医疗数据的挖掘应用。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的缺陷,提供一种疾病编码转换的方法。本专利技术解决上述技术问题的技术方案如下:一种疾病编码转换的方法,包括以下步骤:S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库,并按照不同版本编码进行分类;S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;S03:根据所述标准字典库和所述测试集,形成术语向量,建立向量空间模型;S04:提取需要进行转换的所述疾病编码的前N位编码值,与所述标准字典库中的各版本所述标准疾病编码进行比对,获取与所述前N位编码值一致的多个版本的初选疾病编码;S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。本专利技术的有益效果是:通过建立标准字典库和测试集,形成术语向量,建立向量空间模型,然后通过计算相似度值,获取与相似度最大值对应的特定版本的初选疾病编码,初步确定转换的疾病编码;通过根据临床规则,校验映射关系,确保转换的疾病编码的准确度,实现各个版本疾病编码之间的转换。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步:所述标准诊断描述包括标准手术与操作描述。进一步:所述测试集包括疾病编码测试集和诊断文字测试集,其中,所述疾病编码测试集与需要进行转换的疾病编码相对应,所述诊断文字测试集与所述诊断描述相对应。进一步:所述步骤S03具体包括以下步骤:S03.1:根据所述标准字典库,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,生成标准字典库词包;S03.2:根据所述测试集,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,按照预先配置的同义词库,对出现的同义词进行一致化处理,生成测试库词包;S03.3:将所述标准字典库词包和所述测试库词包中所涉及到的不重复词汇制作为术语词包;S03.4:根据所述术语词包形成术语向量,建立向量空间模型。进一步:计算相似度值的公式为,其中,表示第i个标准字典术语的术语向量,表示第j个测试集术语的术语向量。上述进一步方案的有益效果是:利用余弦相似性等算法,实现了不同ICD(国际疾病分类)编码版本间自动转换,大大提升了编码转换的效率和准确性。进一步:所述临床规则包括部位规则、病因规则、术式规则。上述进一步方案的有益效果是:提高获取的特定版本的初选疾病编码与需要进行转换的疾病编码之间的映射关系校验的准确度。进一步:所述步骤S04中,N为大于3或者等于3的自然数,且N位值包括所述疾病编码的小数点在内。上述进一步方案的有益效果是:提高匹配度及匹配准确率。进一步:在确定转换的疾病编码之后,还包括,将所述转换的疾病编码发送到医学专家端进行审核。上述进一步方案的有益效果是:优化编码转换效果。附图说明图1为本专利技术一种疾病编码转换的方法的流程图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。如图1所示,一种疾病编码转换的方法,其包括以下步骤:S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库,并按照不同版本编码进行分类;S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;S03:根据所述标准字典库和所述测试集,形成术语向量,建立向量空间模型;S04:提取需要进行转换的所述疾病编码的前N位编码值,与所述标准字典库中的各版本所述标准疾病编码进行比对,获取与所述前N位编码值一致的多个版本的初选疾病编码;S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。所述临床规则包括部位规则、病因规则、术式规则。优选的,所述步骤S01中,所述标准诊断描述包括标准手术与操作描述,为医生对病人写的主要诊断文字描述。所述步骤S02中,所述测试集包括疾病编码测试集和诊断文字测试集,其中,所述疾病编码测试集与需要进行转换的疾病编码相对应,所述诊断文字测试集与所述诊断描述相对应。所述步骤S03具体包括以下步骤:S03.1:根据所述标准字典库,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,生成标准字典库词包;S03.2:根据所述测试集,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,按照预先配置的同义词库,对出现的同义词进行一致化处理,生成测试库词包;S03.3:将所述标准字典库词包和所述测试库词包中所涉及到的不重复词汇制作为术语词包;其中,所述术语词包中包含多条标准字典库术语和多条测试术语;S03.4:根据所述术语词包形成术语向量,建立向量空间模型。所述步骤S04中,N为大于3或者等于3的自然数,且N位值包括所述疾病编码的小数点在内。其中,每一条所述标准字典库术语均对应有标准字典库术语向量,每一条所述测试术语均对应有测试术语向量。形成术语向量的方式为,采用one-hot-encoding(独热码)的方式为每一条所述标准字典库术语和每一条所述测试术语分别形成对应的标准字典库术语向量和测试术语向量,以便建立向量空间模型。优选的,所述步骤S05中,计算相似度值的公式为,其中,表示第i个标准字典术语的术语向量,表示第j个测试集术语的术语向量。本专利技术在ICD编码识别转换中创新应用了自然语言识别(NLP)技术,利用one-hot-encoding构建文本向量空间模型,同时结合余弦相似性等算法,实现了不同编码版本间转换,提升了编码转换的效率,为医疗数据应用(如医学研究、疾病控费管理)奠定了基础。具体地是依据领域专家配置的转换规则及相似度算法构建转换器,当需要对新来的文字诊断进行编码转换时,使用这一转换器,即可输出待转换的术语的目标版本疾病编码,实现一键转本文档来自技高网...

【技术保护点】
1.一种疾病编码转换的方法,其特征在于,包括以下步骤:S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库,并按照不同版本编码进行分类;S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;S03:根据所述标准字典库和所述测试集,形成术语向量,建立向量空间模型;S04:提取需要进行转换的所述疾病编码的前N位编码值,与所述标准字典库中的各版本所述标准疾病编码进行比对,获取与所述前N位编码值一致的多个版本的初选疾病编码;S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。

【技术特征摘要】
1.一种疾病编码转换的方法,其特征在于,包括以下步骤:S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库,并按照不同版本编码进行分类;S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;S03:根据所述标准字典库和所述测试集,形成术语向量,建立向量空间模型;S04:提取需要进行转换的所述疾病编码的前N位编码值,与所述标准字典库中的各版本所述标准疾病编码进行比对,获取与所述前N位编码值一致的多个版本的初选疾病编码;S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。2.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述标准诊断描述包括标准手术与操作描述。3.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述测试集包括疾病编码测试集和诊断文字测试集,其中,所述疾病编码测试集与需要进行转换的疾病编码相对应,所述诊断文字测试集与所述诊断描述相对应。4.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述步骤S03具体包...

【专利技术属性】
技术研发人员:孙闯火立龙
申请(专利权)人:武汉金豆医疗数据科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1