一种医院疾病诊断分类自动编码的方法及系统技术方案

技术编号:30172537 阅读:23 留言:0更新日期:2021-09-25 15:31
本发明专利技术提出了一种医院疾病诊断分类自动编码的方法及系统,包括:获取医保疾病诊断数据并进行预处理;将医保疾病诊断数据与国际疾病标准分类编码ICD

【技术实现步骤摘要】
一种医院疾病诊断分类自动编码的方法及系统


[0001]本专利技术属于自然语言处理
,尤其涉及一种医院疾病诊断分类自动编码的方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]医院对医保信息标准化也越来越重视,医生手书的诊断文字的组织方式可能和ICD

10编码中真实概念的书写方式差异巨大,编码员水平存在差异,造成了病案数据的参差不齐,疾病诊断编码质量不能得到有效保障,医保疾病诊断分类编码效率及准确率比较低。
[0004]现有的专利文献中,公开了相关的自动编码方案,部分采用了自然语言处理技术,在文本表示方面,多采用one

hot编码形式对文字进行处理得到词向量,此种方法是基于词与词之间相互独立的情况,未考虑词与词之间的关系问题,且得到的特征是离散的,稀疏的。

技术实现思路

[0005]为克服上述现有技术的不足,本专利技术提供了一种医院疾病诊断分类自动编码的方法,基于word2vec模型能够实现对医院疾病诊断分类自动编码。
[0006]为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:
[0007]第一方面,公开了一种医院疾病诊断分类自动编码的方法,包括:
[0008]获取医保疾病诊断数据并进行预处理;
[0009]将医保疾病诊断数据与国际疾病标准分类编码ICD

10中条目名称匹配的数据进行编码并将该数据存储到医院疾病诊断与医保ICD

10诊断代码映射关系库中;
[0010]针对无法匹配编码的数据,依据关系库中不同版本之间的映射关系进行处理,对成功映射的医院疾病诊断名称自动编码,并存储于映射关系库中;
[0011]针对不符合医保编码的数据进行分词处理,生成分词列表,计算两个词的相关程度,得出最佳匹配,并存储于关系库中;
[0012]输出自动编码结果。
[0013]进一步的技术方案,依据关系库中不同版本之间的映射关系进行处理,包括:疾病诊断数据与国临版、国标版、团标版与医保版对照关系,自动对成功匹配的疾病诊断名称进行编码。
[0014]进一步的技术方案,针对一句不同版本对照关系依然无法自动编码的疾病诊断数据,进行自然语言处理,构造中文词向量Word2vec训练模型,通过词语相似度计算,得出最优匹配疾病诊断并进行编码。
[0015]进一步的技术方案,词语相似度计算,具体为:对分词结果处理转化为向量空间中
的向量运算,计算两个词的相似程度,计算生成某个词的相关词列表,寻找关联程度最高的词语。
[0016]进一步的技术方案,输出自动编码结果中包括不能匹配的疾病诊断数据。
[0017]第二方面,公开了一种医院疾病诊断分类自动编码的系统,包括:
[0018]医院疾病诊断数据库模块,被配置为:存储医保疾病诊断数据并进行预处理;
[0019]诊断名称自动编码模块,被配置为:将医保疾病诊断数据与国际疾病标准分类编码ICD

10中条目名称匹配的数据进行编码并将该数据存储到医院疾病诊断与医保ICD

10诊断代码映射关系库中;
[0020]不同版本对照关系自动编码模块,被配置为:针对无法匹配编码的数据,依据关系库中不同版本之间的映射关系进行处理,对成功映射的医院疾病诊断名称自动编码,并存储于映射关系库中;
[0021]文本相似度匹配编码模块,被配置为:针对不符合医保编码的数据进行分词处理,生成分词列表,计算两个词的相关程度,得出最佳匹配,并存储于关系库中。
[0022]进一步的技术方案,还包括:医院疾病诊断分类自动编码结果输出模块,被配置为:输出自动编码结果,输出自动编码结果中包括不能匹配的疾病诊断数据。
[0023]进一步的技术方案,还包括:诊断代码自动编码模块,被配置为:针对自动对成功匹配的疾病诊断名称且进行编码的数据,自动筛选出符合医保版编码的数据,存储到映射关系库中。
[0024]以上一个或多个技术方案存在以下有益效果:
[0025]本专利技术能够对疾病诊断与医保版ICD

10进行自动映射并进行编码,可以提高临床医师正确书写疾病诊断、编码人员正确编码归类的水平及正确率,为医院DRGs的绩效评价和合理控费奠定基础,促进医院医疗安全质量和服务水平的提高,有利于加强医院经营管理工作,推进医院精细化管理。
[0026]同时通过本专利技术的技术方案可以提高医保医疗业务信息编码的标准化程度,提高数据质量,为实现不同区域、不同医疗机构之间的数据共享开放提供支撑。
[0027]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0028]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0029]图1是本专利技术一种基于word2vec模型的医院疾病诊断分类自动编码的装置的构成;
[0030]图2是本专利技术一种基于word2vec模型的医院疾病诊断分类自动编码的方法过程;
[0031]图3是本专利技术的示例A;
[0032]图4是本专利技术ICD

10国标版与医保版对照库示例;
[0033]图5是本专利技术ICD

10国临版与医保版对照库示例;
[0034]图6是本专利技术实施例子总体采用的数据匹配结果;
[0035]图7

9是本专利技术实施例子不能匹配的结果。
具体实施方式
[0036]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0037]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0038]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0039]实施例一
[0040]参见附图2所示,本实施例公开了一种医院疾病诊断分类自动编码的方法,针对医院的疾病诊断数据,通过与医保条目(诊断)名称、诊断代码匹配进行自动编码;对疾病诊断名称进行分词处理,构造中文词向量Word2vec训练模型,通过词语相似度计算,得出最优匹配疾病诊断并进行正确编码;将正确编码的数据存储于医院疾病诊断与医保ICD

10映射关系库中。
[0041]更为具体的包括以下步骤:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医院疾病诊断分类自动编码的方法,其特征是,包括:获取医保疾病诊断数据并进行预处理;将医保疾病诊断数据与国际疾病标准分类编码ICD

10中条目名称匹配的数据进行编码并将该数据存储到医院疾病诊断与医保ICD

10诊断代码映射关系库中;针对无法匹配编码的数据,依据关系库中不同版本之间的映射关系进行处理,对成功映射的医院疾病诊断名称自动编码,并存储于映射关系库中;针对不符合医保编码的数据进行分词处理,生成分词列表,计算两个词的相关程度,得出最佳匹配,并存储于关系库中;输出自动编码结果。2.如权利要求1所述的一种医院疾病诊断分类自动编码的方法,其特征是,依据关系库中不同版本之间的映射关系进行处理,包括:疾病诊断数据与国临版、国标版、团标版与医保版对照关系,自动对成功匹配的疾病诊断名称进行编码。3.如权利要求1所述的一种医院疾病诊断分类自动编码的方法,其特征是,针对一句不同版本对照关系依然无法自动编码的疾病诊断数据,进行自然语言处理,构造中文词向量Word2vec训练模型,通过词语相似度计算,得出最优匹配疾病诊断并进行编码。4.如权利要求1所述的一种医院疾病诊断分类自动编码的方法,其特征是,词语相似度计算,具体为:对分词结果处理转化为向量空间中的向量运算,计算两个词的相似程度,计算生成某个词的相关词列表,寻找关联程度最高的词语。5.如权利要求1所述的一种医院疾病诊断分类自动编码的方法,其特征是,输出自动编码结果中包括不能匹配的疾病诊断数据。6.一种医院疾病诊断分类自动编码的系统,其特征是,包...

【专利技术属性】
技术研发人员:钱进赵永光朱晓洪刘颖赵静张龙王通智高超
申请(专利权)人:山大地纬软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1