疾病分类编码识别方法、装置及存储介质制造方法及图纸

技术编号:25398064 阅读:33 留言:0更新日期:2020-08-25 23:02
本发明专利技术各实施例公开了一种疾病分类编码识别方法、装置、计算机设备及存储介质,其中,所述疾病分类编码识别方法包括:获取诊断数据;将所述诊断数据作为源语言输入机器翻译模型,所述机器翻译模型包括编码网络和解码网络;通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征;将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。采用本发明专利技术所提供的疾病分类编码识别方法、装置、计算机设备及存储介质解决了现有技术中疾病分类编码识别的准确率不高的问题。

【技术实现步骤摘要】
疾病分类编码识别方法、装置及存储介质
本专利技术涉及计算机
,尤其涉及一种疾病分类编码识别方法、装置及存储介质。
技术介绍
随着医学技术的发展,国际疾病分类(ICD,InternationalClassificationofDiseases)编码已被广泛地应用于描述病人病情,例如病因、损伤、死因等等。因此,如何快速地将医生关于病人病情描述的非标准化的数据转化为标准化的疾病分类编码便具有重要意义。通常,上述非标准化至标准化的转化过程,是由医院专门的编码员为医生给出的关于病人病情描述的数据赋予疾病分类编码。这就要求编码员需要掌握许多特殊技能,例如医学知识、编码规则、医学术语等等,进而导致依赖于人工实现的疾病分类编码识别不仅人力成本非常昂贵,而且效率过于低下。为此,基于计算机设备的疾病分类编码识别应运而生,然而,无论是基于字典检索技术的疾病分类编码识别,或者基于分类学习的疾病分类编码识别,虽然在一定程度上缓解了人工实现的困境,但不可避免地存在因数据稀疏,而难以保证疾病分类编码识别的准确率。由上可知,现有的疾病分类编码识别本文档来自技高网...

【技术保护点】
1.一种疾病分类编码识别方法,其特征在于,包括:/n获取诊断数据;/n将所述诊断数据作为源语言输入机器翻译模型,所述机器翻译模型包括编码网络和解码网络;/n通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征;/n将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。/n

【技术特征摘要】
1.一种疾病分类编码识别方法,其特征在于,包括:
获取诊断数据;
将所述诊断数据作为源语言输入机器翻译模型,所述机器翻译模型包括编码网络和解码网络;
通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征;
将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,所述目标语言为所述诊断数据匹配的疾病分类编码。


2.如权利要求1所述的方法,其特征在于,所述编码网络包括第一嵌入层和若干个编码子层;
所述通过所述编码网络进行所述源语言的特征提取,得到所述源语言的特征,包括:
在所述第一嵌入层中,将所述源语言中的分词映射为待编码向量;
通过若干个所述编码子层对所述待编码向量进行特征提取,得到所述源语言的特征。


3.如权利要求2所述的方法,其特征在于,所述编码子层包括第一多头注意力层、第一全连接层和第一残差连接层;
所述通过若干个所述编码子层对所述待编码向量进行特征提取,得到所述源语言的特征,包括:
针对每一个编码子层,接收该编码子层的输入向量作为所述第一多头注意力层的输入向量,由所述第一多头注意力层的输入端输入;所述待编码向量作为第一个编码子层的输入向量;
通过连接于所述第一多头注意力层的第一残差连接层,使得所述第一多头注意力层的输入向量与输出向量融合,并传输至所述第一全连接层;
通过连接于所述第一全连接层的第一残差连接层,使得所述第一全连接层的输入向量与输出向量融合,得到该编码子层的输出向量;该编码子层的输出向量作为后一个编码子层的输入向量;
将最后一个编码子层的输出向量作为所述源语言的特征。


4.如权利要求3所述的方法,其特征在于,所述第一多头注意力层的输入端包括Q1输入端、K1输入端和V1输入端;
所述针对每一个编码子层,接收该编码子层的输入向量作为所述第一多头注意力层的输入向量,由所述第一多头注意力层的输入端输入,包括:
在所述编码子层中,将所述编码子层的输入向量通过Q1输入端、K1输入端和V1输入端输入所述第一多头注意力层,分别作为所述第一多头注意力层的Q端输入向量、K端输入向量和V端输入向量。


5.如权利要求1所述的方法,其特征在于,所述解码网络包括第二嵌入层和若干个解码子层;
所述将所述源语言的特征输入所述解码网络进行解码,使得所述源语言被翻译为目标语言,包括:
将所述源语言的特征输入所述第二嵌入层进行映射,得到待解码向量;
通过若干个所述解码子层进行所述待解码向量的解码,得到所述目标语言。


6.如权利要求5所述的方法,其特征在于,所述解码子层包括第二多头注意力层、第三多头注意力层、第二全连接层、第二残差连接层和第三残差连接层;
所述通过若干个所述解码子层进行所述待解码向量的解码,得到所述目标语言,包括:
针对每一个解码子层,接收该解码子层的输入向量作为所述第二多头注意力层的输入向量,由所述第二多头注...

【专利技术属性】
技术研发人员:陈逸龙
申请(专利权)人:广州天鹏计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1