一种用于疾病诊断的自动编码方法及系统技术方案

技术编号:28562485 阅读:12 留言:0更新日期:2021-05-25 17:58
本发明专利技术提供了一种用于疾病诊断的自动编码方法及系统,获取临床诊断结果,对临床诊断结果进行实体识别和实体关系的识别,标注出实体及其所属实体类型;基于识别出的实体在知识图谱上搜索出与之直接关联的关联实体;搜索所有能够覆盖实体和关联实体的候选标准诊断;基于预设的编码规则,搜索所有可能的编码组合结果,对所有编码组合结果计算指标系数,并依据结果排序,选取最合适的结果作为最终编码结果;本发明专利技术利用人工智能的技术,自动对临床诊断进行语义理解,并结合医学知识和ICD的编码规则进行编码。

【技术实现步骤摘要】
一种用于疾病诊断的自动编码方法及系统
本专利技术属于医疗编码
,具体涉及一种用于疾病诊断的自动编码方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。医学是研究疾病的学科,那么不可避免的要面对一个问题,如何在交流、数据交换和统计分析中,准确的标识出每一种疾病或者疾病概念。首先根据名称是不可行的,名称是借助语言工具来描述特定的概念,不可避免的要收到语言的特性的影响:跨语言问题,同种疾病在不同语种的名称表述不同;语言表达的多样性自由行导致的名称不一致,比如新生儿红臀与尿布疹,是一种疾病概念的两种表达方式,尤其是在汉语中,这种情况非常非常普遍;有些疾病指代的是一些复杂情况,这些情况本身表述起来就不完全一样,比如,产程开始24小之内的胎膜早破与产程开始之后超过24小时的胎膜早破是两个诊断,他们之间的区别就在于两个事件之间的间隔。如果不仅仅算上病因,发病部位,再加上分期分型等,那么疾病的种类数量将是一个天文数字,这么大的种类数量,在使用的时将会存在巨大的检索困难。所以,世界卫生组织所属的分类家族(TheInternationalClassificationofFunctioning)现在管理和维护的ICD(InternationalClassificationofDiseases)是主要以病因、解剖部位、临床表现和病理等分类轴心(通俗的讲,叫分类依据,官方的命名叫分类轴心)对疾病进行分类并标识的一个疾病分类体系,疾病分类标识的后,大量的疾病按照上述的分类轴心后只剩下几万种疾病,种类数量大大减少。比如:轻度脱水、中度脱水,和重度脱水均属于脱水等等。疾病分类体系给疾病的标识和疾病数据的统计带来的可行之路,在世界范围内推广使用,所有世卫组织的成员国均推广使用ICD疾病分类编码体系(以下简称ICD),但由于ICD、是分类体系,分类过程不可避免的存在信息缺失,后来变为描述体系:使用多编码后组配(postcoordinate)的方式对临床诊断进行编码,诊断中的每个实体描述都会被编码,最后组合为一个诊断编码,这种方式解决了疾病诊断的含义在分类过程中丢失的问题。但是这个编码的检索使用,目前只能通过关键词或者拼音简码的检索方式,检索出诊断中每个部分的编码,然后组合到一起,使用起来不方便。一方面由于临床的术语与ICD标准诊断编码的术语存在不兼容性,另外一方面,每个部分的检索对临床医生和编码员来说太麻烦,一个诊断要反复检索多次才能组合出一个编码结果,而且还存组合错误的情况,因为一个临床诊断,会出在多种后组配编码方式,但是有些是不符合规则的。并且,编码是一个独立的学科,由此诞生的岗位叫编码员。一个编码员在接收国家培训并发合格证后,往往要几年的工作实践才能胜任编码工作,并且,因为编码规则只有比较粗的原则性规则,不会具体到每种疾病每种情况的规则,所以在实际工作中,每个编码员都会衍生出自己认为合理的细节规则,进而造成不同编码员对同一个疾病编码不统一的情况。
技术实现思路
本专利技术为了解决上述问题,提出一种用于疾病诊断的自动编码方法及系统,本专利技术利用人工智能的技术,自动对临床诊断进行语义理解,并结合医学知识和ICD的编码规则进行编码。根据一些实施例,本专利技术采用如下技术方案:一种用于疾病诊断的自动编码方法,包括以下步骤:获取临床诊断结果,对临床诊断结果进行实体识别和实体关系的识别,标注出实体及其所属实体类型;基于识别出的实体在知识图谱上搜索出与之直接关联的关联实体;搜索所有能够覆盖实体和关联实体的候选标准诊断;基于预设的编码规则,搜索所有可能的编码组合结果,对所有编码组合结果计算指标系数,并依据结果排序,选取最合适的结果作为最终编码结果。作为可选择的实施方式,对临床诊断结果进行实体识别和实体关系的识别的具体过程:对输入的原始临床诊断进行实体识别和实体关系的识别,标注出实体及其所属实体类型,标注出实体之间的修饰和限制关系。作为可选择的实施方式,所述医学实体包括疾病异常、解剖部位、病因、临床表现、病理和微生物的实体概念,以及名称、别名实体表述,实体之间关系包括所属、包含、导致、表现、修饰限制和名称,实体之间的关系是双向的。作为可选择的实施方式,所述实体之间的关系具有权重系数,代表两个实体之间的关系强弱程度。作为可选择的实施方式,搜索所有能够覆盖实体和关联实体的候选标准诊断的具体过程包括,在标准诊断数据库中,提前保存实体和实体关系树形结构,形成知识图谱,根据得到的实体和实体关系,在标准诊断的树形语义结构知识图谱中搜索能符合的标准诊断的实体和实体关系。作为可选择的实施方式,单个候选诊断表达临床诊断含义的程度,有以下参数:1)表达出临床诊断的实体概念数量;2)具体表达出临床诊断的实体;3)表示出对应的实体的权重转化系数之积。作为可选择的实施方式,对所有编码组合结果计算指标系数,并依据结果排序的具体过程包括:候选标准诊断编码中,选出多个编码组合起来,表达出临床诊断的概念含义,要符合以下要求:临床诊断每个实体尽可能由转化系数接近1的标准诊断实体表示出来;尽可能用少的编码组合起来覆盖临床诊断中所有实体概念,即不要有冗余编码。作为可选择的实施方式,对所有编码组合结果计算指标系数,并依据结果排序的具体过程中,采用树形遍历搜索方式,搜索所有符合要求编码组合。作为可选择的实施方式,采用树形遍历搜索方式的具体过程包括:(1)从临床诊断的主关键词开始,以覆盖主关键词的主干码标准编码为搜索分支起点,每个可以覆盖主关键词的标准编码的实体;(2)主干码选取完后,在还未被覆盖的实体中,以及被主干码覆盖但是转化权重不是1的实体里,选取一个实体,搜索可覆盖此实体的扩展码,作为第二层搜索分支;反复执行该步骤,直到所有临床诊断的实体都被覆盖,或者剩余的实体都没有标准编码可以覆盖。作为可选择的实施方式,对所有编码组合结果计算指标系数的具体过程包括:依次比较临床诊断实体覆盖表示比例μ、实体权重转化系数乘积ρ、使用编码数量k,主干码对临床诊断实体覆盖比例μt,主干码实体权重转化系数乘积ρt,主干码数量kt,并且按上述指标排序,排序最前面的编码组合为该临床诊断最合适的编码结果。一种用于疾病诊断的自动编码系统,包括:标注模块,被配置为获取临床诊断结果,对临床诊断结果进行实体识别和实体关系的识别,标注出实体及其所属实体类型;搜索模块,被配置为基于识别出的实体在知识图谱上搜索出与之直接关联的关联实体,搜索所有能够覆盖实体和关联实体的候选标准诊断;选择模块,被配置为基于预设的编码规则,搜索所有可能的编码组合结果,对所有编码组合结果计算指标系数,并依据结果排序,选取最合适的结果作为最终编码结果。与现有技术相比,本专利技术的有益效果为:本专利技术实现诊断编码工作的自动化,即解决医疗机构无编码员或编码员配备不足的问题,降低人力资源成本,解决编码员培训成本高的问题,又可以保证本文档来自技高网
...

【技术保护点】
1.一种用于疾病诊断的自动编码方法,其特征是:包括以下步骤:/n获取临床诊断结果,对临床诊断结果进行实体识别和实体关系的识别,标注出实体及其所属实体类型;/n基于识别出的实体在知识图谱上搜索出与之直接关联的关联实体;/n搜索所有能够覆盖实体和关联实体的候选标准诊断;/n基于预设的编码规则,搜索所有可能的编码组合结果,对所有编码组合结果计算指标系数,并依据结果排序,选取最合适的结果作为最终编码结果。/n

【技术特征摘要】
1.一种用于疾病诊断的自动编码方法,其特征是:包括以下步骤:
获取临床诊断结果,对临床诊断结果进行实体识别和实体关系的识别,标注出实体及其所属实体类型;
基于识别出的实体在知识图谱上搜索出与之直接关联的关联实体;
搜索所有能够覆盖实体和关联实体的候选标准诊断;
基于预设的编码规则,搜索所有可能的编码组合结果,对所有编码组合结果计算指标系数,并依据结果排序,选取最合适的结果作为最终编码结果。


2.如权利要求1所述的一种用于疾病诊断的自动编码方法,其特征是:对临床诊断结果进行实体识别和实体关系的识别的具体过程:对输入的原始临床诊断进行实体识别和实体关系的识别,标注出实体及其所属实体类型,标注出实体之间的修饰和限制关系。


3.如权利要求1所述的一种用于疾病诊断的自动编码方法,其特征是:所述医学实体包括疾病异常、解剖部位、病因、临床表现、病理和微生物的实体概念,以及名称、别名实体表述,实体之间关系包括所属、包含、导致、表现、修饰限制和名称,实体之间的关系是双向的;所述实体之间的关系具有权重系数,代表两个实体之间的关系强弱程度。


4.如权利要求1所述的一种用于疾病诊断的自动编码方法,其特征是:搜索所有能够覆盖实体和关联实体的候选标准诊断的具体过程包括,在标准诊断数据库中,提前保存实体和实体关系树形结构,形成知识图谱,根据得到的实体和实体关系,在标准诊断的树形语义结构知识图谱中搜索能符合的标准诊断的实体和实体关系。


5.如权利要求1所述的一种用于疾病诊断的自动编码方法,其特征是:单个候选诊断表达临床诊断含义的程度,有以下参数:
1)表达出临床诊断的实体概念数量;
2)具体表达出临床诊断的实体;
3)表示出对应的实体的权重转化系数之积。


6.如权利要求1所述的一种用于疾病诊断的自动编码方法,其特征是:对所有编码组合结果计算指标系数,并依据结果排序的具体过程包括:候选标准...

【专利技术属性】
技术研发人员:桑波吴军高希余樊昭磊李森李福友
申请(专利权)人:山东众阳健康科技集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1