一种基于词向量的诊断标准化方法及装置制造方法及图纸

技术编号:21004205 阅读:43 留言:0更新日期:2019-04-30 21:33
本发明专利技术公开了一种基于词向量的诊断标准化方法及装置,该方法包括:S1:获取待处理的诊断语句,对待处理的诊断语句进行分词处理,获取分词结果;S2:根据分词结果以及预构的相应模型,建立待处理的诊断语句的词向量、词信息量以及词性标注结果;S3:根据词向量、词信息量以及词性标注结果,分别计算待处理的诊断语句与标准库中相关标准诊断语句的相似度;S4:选取与待处理的诊断语句最相似的标准诊断语句作为诊断语句的标准化结果。本发明专利技术通过计算待处理的诊断语句与当前诊断最接近的标准诊断语句的语义相似度,选取与待处理的诊断语句相似度最高的标准诊断语句作为标准化结果,以及定期对相应模型进行更新,提高诊断标准化的正确率。

A Standardization Method and Device for Diagnosis Based on Word Vector

【技术实现步骤摘要】
一种基于词向量的诊断标准化方法及装置
本专利技术涉及数据处理
,特别涉及一种基于词向量的诊断标准化方法及装置。
技术介绍
在保险理赔和医学研究统计方面,疾病的诊断标准化具有重要的意义。目前疾病标准包括国际权威发布的ICD-10(国际疾病分类)。但是,一方面不同医院有着不同的ICD-10诊断标准,另一方面医生的手写诊断与标准的诊断有一定的差距,如何将不同医院中的不标准诊断进行统一的标准化,是一个非常具有现实意义的问题。目前的诊断标准化方法存在以下问题:1、完全采用无监督的自然语言处理方法,不利用已有的标注资源,准确率较低;2、依赖人工修订与标注,包括同一个ICD-10疾病的不同称呼和ICD-10的频繁修订,需耗费大量人力资源。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种基于词向量的诊断标准化方法及装置,以克服现有技术中依赖人工修订与标注需耗费大量人力资源、完全采用无监督的自然语言处理方法,不利用已有的标注资源,准确率较低等问题。为解决上述技术问题,本专利技术采用的技术方案是:一方面,提供了一种基于词向量的诊断标准化方法,所述方法包括如下步骤:S1:获取待处理的诊本文档来自技高网...

【技术保护点】
1.一种基于词向量的诊断标准化方法,其特征在于,所述方法包括如下步骤:S1:获取待处理的诊断语句,对所述待处理的诊断语句进行分词处理,获取分词结果:S2:根据所述分词结果以及预构的相应模型,建立所述待处理的诊断语句的词向量、词信息量以及词性标注结果;S3:根据所述词向量、词信息量以及词性标注结果,分别计算所述待处理的诊断语句与标准库中相关标准诊断语句的相似度;S4:选取与所述待处理的诊断语句最相似的标准诊断语句作为所述诊断语句的标准化结果。

【技术特征摘要】
1.一种基于词向量的诊断标准化方法,其特征在于,所述方法包括如下步骤:S1:获取待处理的诊断语句,对所述待处理的诊断语句进行分词处理,获取分词结果:S2:根据所述分词结果以及预构的相应模型,建立所述待处理的诊断语句的词向量、词信息量以及词性标注结果;S3:根据所述词向量、词信息量以及词性标注结果,分别计算所述待处理的诊断语句与标准库中相关标准诊断语句的相似度;S4:选取与所述待处理的诊断语句最相似的标准诊断语句作为所述诊断语句的标准化结果。2.根据权利要求1所述的基于词向量的诊断标准化方法,其特征在于,所述建立所述待处理的诊断语句的词向量、词信息量以及词性标注结果前还包括:根据预构的缩写词库,将所述分词结果中的缩写词转换为对应的标准词。3.根据权利要求1或2所述的基于词向量的诊断标准化方法,其特征在于,所述步骤S3具体包括:S3.1:根据所述词向量以及词性标注结果,计算所述分词结果与所述标准库中相关标准诊断语句的词相似度;S3.2:根据所述词相似度以及所述词信息量,分别计算所述处理的诊断语句与所述标准库中相关标准诊断语句的相似度。4.根据权利要求1或2所述的基于词向量的诊断标准化方法,其特征在于,所述步骤S4具体包括:将所述待处理的诊断语句与标准库中相关标准诊断语句的相似度进行排序处理,根据排序结果,选取与所述待处理的诊断语句的最相似的标准诊断语句作为所述诊断语句的标准化结果。5.根据权利要求1或2所述的基于词向量的诊断标准化方法,其特征在于,所述方法还包括:S5:将纠正的诊疗-标准对作为训练语料,对预构的相应模型进行补充训练,并对训练后的相应模型进行准确率评估,用评估合格的相应模型替换原有模型。6.一种基于词向量...

【专利技术属性】
技术研发人员:李玉娇陆王天宇谭炎吴栋梁
申请(专利权)人:众安信息技术服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1