【技术实现步骤摘要】
ICD编码方法、装置及电子设备
[0001]本公开涉及人工智能领域,具体涉及大数据、医疗数据分析技术等
,具体涉及大数据
,尤其涉及一种ICD编码方法、装置及电子设备。
技术介绍
[0002]国际疾病分类(International Classification of Diseases,ICD)是一种国际统一的疾病分类方法,它根据疾病的病因、病理、临床表现和解剖位置等,将疾病分门别类,使其成为一个有序的组合,并用编码的方法来表示的系统。
[0003]在相关技术中,医护人员可以通过编码器对医疗文档进行ICD编码预测,以此获得医疗文档对应的ICD编码。
技术实现思路
[0004]本公开提供了一种ICD编码方法、装置及电子设备。
[0005]根据本公开的一方面,提供了一种ICD编码方法,包括:
[0006]获取N个编码文本,所述N个编码文本分别用于描述N个ICD编码,N为大于1的正整数;
[0007]基于所述N个ICD编码之间的层级关系,分别确定每个编码文本相关联的目标I ...
【技术保护点】
【技术特征摘要】
1.一种国际疾病分类ICD编码方法,包括:获取N个编码文本,所述N个编码文本分别用于描述N个ICD编码,N为大于1的正整数;基于所述N个ICD编码之间的层级关系,分别确定每个编码文本相关联的目标ICD编码层,所述N个ICD编码预先被划分为多个ICD编码层,所述目标ICD编码层为所述多个ICD编码层中的ICD编码层;针对每个编码文本,基于所述N个ICD编码之间的共现关系和所述编码文本相关联的目标ICD编码层,生成用于表示所述编码文本的第一向量;提取待识别的医疗文本的第一特征向量;基于所述第一特征向量和所述N个编码文本的第一向量,在所述N个ICD编码中,确定所述医疗文本对应的目标ICD编码。2.根据权利要求1所述的方法,其中,所述基于所述N个ICD编码之间的层级关系,分别确定每个编码文本相关联的目标ICD编码层,包括:针对每个编码文本,提取所述编码文本的第二特征向量;基于所述N个ICD编码之间的层级关系以及所述编码文本所描述的ICD编码,确定所述编码文本的第二特征向量相关联的目标编码层。3.根据权利要求2所述的方法,其中,所述针对每个编码文本,提取所述编码文本的第二特征向量,包括:针对每个编码文本,对所述编码文本进行分词处理,获得所述编码文本的多个分词;提取每个分词的词向量,获得所述编码文本的多个词向量;通过预设的第一长短期记忆网络对所述多个词向量进行卷积运算,获得所述多个分词的特征向量;通过预设的第一自注意力层对所述每个分词的特征向量进行加权求和计算,生成所述编码文本的第二特征向量。4.根据权利要求1所述的方法,其中,所述目标ICD编码层包括相关联的编码文本的第二特征向量;所述针对每个编码文本,基于所述N个ICD编码之间的共现关系和所述编码文本相关联的目标ICD编码层,生成用于表示所述编码文本的第一向量,包括:针对每个编码文本,通过预设的图卷积神经网络对所述编码文本相关联的目标ICD编码层的第一层级向量进行卷积运算,获得所述目标ICD编码层的第二层级向量;所述目标ICD编码层的第一层级向量为所述目标ICD编码层包括的第二特征向量的平均值,所述图卷积神经网络包括的邻接矩阵基于预设的编码文本数据集中所述N个ICD编码之间的共现关系确定;通过预设的第二自注意力层对所述目标ICD编码层的第二层级向量进行加权求和计算,生成用于表示所述编码文本的第一向量。5.根据权利要求1所述的方法,其中,所述基于所述第一特征向量和所述N个编码文本的第一向量,在所述N个ICD编码中,确定所述医疗文本对应的目标ICD编码,包括:针对每个编码文本,基于预设的权重参数、预设的偏执参数、预设的关联参数、所述第一特征向量以及所述编码文本的第一向量,确定所述编码文本所描述的ICD编码的编码概率;
将所述N个ICD编码中编码概率超过预设阈值的ICD编码,确定为所述医疗文本对应的目标ICD编码。6.根据权利要求5所述的方法,其中,所述针对每个编码文本,基于预设的权重参数、预设的偏执参数、预设的关联参数、所述第一特征向量以及所述编码文本的第一向量,确定所述编码文本所描述的ICD编码的编码概率,包括:针对每个编码文本,计算所述编码文本的第一向量与第一数值之间的乘积;所述第一数值为双曲函数对第二数值的计算结果,所述第二数值为所述关联参数与所述第一特征向量之间的乘积;对所述编码文本的第一向量与第一数值之间的乘积进行归一化运算,获得注意力权重参数;将所述注意力权重参数与所述第一特征向量之间的乘积,确定为文本特征向量;将第三数值与所述偏执参数的和值,确定为所述编码文本所描述的ICD编码的编码概率;所述第三数值为所述注意力权重参数与所述文本特征向量之间的乘积。7.根据权利要求1
‑
6中任一项所述的方法,其中,所述提取待识别的医疗文本的第一特征向量,包括:对所述医疗文本进行分词处理,获得所述医疗文本的多个分词;提取每个分词的词向量,获得所述医疗文本的多个词向量;通过预设的第二长短期记忆网络对所述多个词向量进行卷积运算,获得所述医疗文本的第一特征向量。8.一种ICD编码装置,包括:获取模块,用于获取N个编码文本,所述N个编码文本分别用于描述N个ICD编码...
【专利技术属性】
技术研发人员:李徐泓,陈嘉敏,熊昊一,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。