本申请涉及人工智能及数字医疗领域,本申请实施例提供了一种疾病部位识别方法、装置、电子设备及存储介质。该方法包括:获取原始病情文本;通过预先训练的病情匹配模型对原始病情文本进行匹配处理,得到第一疾病部位;通过预先训练的语义分析模型对原始病情文本进行语义分析处理,得到病情语义向量;对病情语义向量进行识别处理,得到第二疾病部位;根据第一疾病部位和第二疾病部位,得到目标疾病部位。本申请实施例能够提高疾病部位识别的准确性。性。性。
【技术实现步骤摘要】
疾病部位识别方法、装置、电子设备及存储介质
[0001]本申请涉及人工智能及数字医疗
,尤其涉及一种疾病部位识别方法、装置、电子设备及存储介质。
技术介绍
[0002]目前被广泛应用于疾病部位识别的人工智能系统大多依靠预先构建的词典来进行文本模糊匹配,对疾病部位识别的精度较低,此外,该方式往往需要对词典不断地迭代更新,以扩充词典内的词段文本来提高自身的匹配性能,需要花费较大的时间成本和人力成本。因此,如何提供一种疾病部位识别方法,能够提高疾病部位识别的准确性,成为了亟待解决的技术问题。
技术实现思路
[0003]本申请实施例的主要目的在于提出一种疾病部位识别方法、装置、电子设备及存储介质,旨在提高疾病部位识别的准确性。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种疾病部位识别方法,所述方法包括:
[0005]获取原始病情文本;
[0006]通过预先训练的病情匹配模型对所述原始病情文本进行匹配处理,得到第一疾病部位;
[0007]通过预先训练的语义分析模型对所述原始病情文本进行语义分析处理,得到病情语义向量;
[0008]对所述病情语义向量进行识别处理,得到第二疾病部位;
[0009]根据所述第一疾病部位和所述第二疾病部位,得到目标疾病部位。
[0010]在一些实施例,所述通过预先训练的病情匹配模型对所述原始病情文本进行匹配处理,得到第一疾病部位的步骤,包括:
[0011]通过所述病情匹配模型的分词器对所述原始病情文本进行分割处理,得到病情文本字段;
[0012]通过所述病情匹配模型内预设的字典树遍历每一所述病情文本字段,得到病情文本关键词;
[0013]根据所述病情匹配模型内预设的疾病部位对照表,匹配与所述病情文本关键词对应的第一疾病部位。
[0014]在一些实施例,在通过预先训练的语义分析模型对所述原始病情文本进行语义分析处理,得到病情语义向量的步骤之前,所述方法还包括预先训练所述语义分析模型,具体包括:
[0015]获取样本病情文本;
[0016]通过预设的对比学习模型对样本病情文本进行编码处理,得到初始嵌入数据;
[0017]根据初始嵌入数据构建样本对,其中,所述样本对包括正例对和负例对;
[0018]通过所述对比学习模型的损失函数计算出所述正例对的第一相似度和所述负例对的第二相似度;
[0019]根据所述第一相似度和所述第二相似度对所述比学习模型的损失函数进行优化,以更新所述对比学习模型,得到所述语义分析模型。
[0020]在一些实施例,在所述预先训练所述语义分析模型的步骤之前,所述方法还包括构建对比学习模型,具体包括:
[0021]获取原始的预训练模型,其中,所述预训练模型为BERT模型,所述BERT模型包括BERT编码器;
[0022]对预训练模型进行参数微调,以更新所述预训练模型,得到对比学习模型。
[0023]在一些实施例,所述通过预先训练的语义分析模型对所述原始病情文本进行语义分析处理,得到病情语义向量的步骤,包括:
[0024]通过所述语义分析模型的嵌入层对所述原始病情文本进行数据预处理,得到标准病情文本;
[0025]通过所述语义分析模型内的BERT编码器对所述标准病情文本进行编码处理,得到病情文本嵌入数据;
[0026]对所述病情文本嵌入数据进行向量化处理,得到病情语义向量。
[0027]在一些实施例,所述对所述病情语义向量进行识别处理,得到第二疾病部位的步骤,包括:
[0028]对所述病情语义向量进行特征提取,得到局部病情特征向量;
[0029]对所述局部病情特征向量进行最大池化处理,得到目标病情特征向量;
[0030]利用预设的激活函数对所述目标病情特征向量进行激活处理,得到每一疾病类别对应的疾病概率值;
[0031]根据所述疾病概率值,得到第二疾病部位。
[0032]在一些实施例,所述根据所述第一疾病部位和所述第二疾病部位,得到目标疾病部位的步骤,包括:
[0033]对所述第一疾病部位和所述第二疾病部位进行比对分析,得到分析结果;
[0034]若所述分析结果为所述第一疾病部位和所述第二疾病部位相同,则将所述第一疾病部位或者所述第二疾病部位作为目标疾病部位;
[0035]若所述分析结果为所述第一疾病部位与所述第二疾病部位不相同,则获取所述第一疾病部位和所述第二疾病部位的优先级,并根据所述优先级将所述第一疾病部位或者所述第二疾病部位作为目标疾病部位。
[0036]为实现上述目的,本申请实施例的第二方面提出了一种疾病部位识别装置,所述装置包括:
[0037]原始病情文本获取模块,用于获取原始病情文本;
[0038]匹配模块,用于通过预先训练的病情匹配模型对所述原始病情文本进行匹配处理,得到第一疾病部位;
[0039]语义分析模块,用于通过预先训练的语义分析模型对所述原始病情文本进行语义分析处理,得到病情语义向量;
[0040]识别模块,用于对所述病情语义向量进行识别处理,得到第二疾病部位;
[0041]比较模块,用于根据所述第一疾病部位和所述第二疾病部位,得到目标疾病部位。
[0042]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现上述第一方面所述的方法。
[0043]为实现上述目的,本申请实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面所述的方法。
[0044]本申请提出的疾病部位识别方法、装置、电子设备及存储介质,其通过获取原始病情文本;通过预先训练的病情匹配模型对原始病情文本进行匹配处理,得到第一疾病部位。这样一来,通过病情匹配模型能够较为方便地根据原始病情文本的文本内容,匹配出与原始病情文本相关性较高的第一疾病部位,提高了匹配效率。另一方面,通过预先训练的语义分析模型对原始病情文本进行语义分析处理,得到病情语义向量,从而对病情语义向量进行识别处理,得到第二疾病部位,能够基于深度语义学习模型来对原始病情文本进行语义识别,得到第二疾病部位。最后,通过比较第一疾病部位和第二疾病部位,得到目标疾病部位。本申请的疾病部位识别方法能够通过病情匹配和深度语义学习两方面来识别疾病部位,相较于传统技术的基于词典的文本模糊匹配,极大地提高了疾病部位识别的准确性。
附图说明
[0045]图1是本申请实施例提供的疾病部位识别方法的流程图;
[0046]图2是图1中的步骤S102的流程图;
[0047]图3是本申请实施例提供的疾病部位本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种疾病部位识别方法,其特征在于,所述方法包括:获取原始病情文本;通过预先训练的病情匹配模型对所述原始病情文本进行匹配处理,得到第一疾病部位;通过预先训练的语义分析模型对所述原始病情文本进行语义分析处理,得到病情语义向量;对所述病情语义向量进行识别处理,得到第二疾病部位;根据所述第一疾病部位和所述第二疾病部位,得到目标疾病部位。2.根据权利要求1所述的疾病部位识别方法,其特征在于,所述通过预先训练的病情匹配模型对所述原始病情文本进行匹配处理,得到第一疾病部位的步骤,包括:通过所述病情匹配模型的分词器对所述原始病情文本进行分割处理,得到病情文本字段;通过所述病情匹配模型内预设的字典树遍历每一所述病情文本字段,得到病情文本关键词;根据所述病情匹配模型内预设的疾病部位对照表,匹配与所述病情文本关键词对应的第一疾病部位。3.根据权利要求1所述的疾病部位识别方法,其特征在于,在通过预先训练的语义分析模型对所述原始病情文本进行语义分析处理,得到病情语义向量的步骤之前,所述方法还包括预先训练所述语义分析模型,具体包括:获取样本病情文本;通过预设的对比学习模型对样本病情文本进行编码处理,得到初始嵌入数据;根据初始嵌入数据构建样本对,其中,所述样本对包括正例对和负例对;通过所述对比学习模型的损失函数计算出所述正例对的第一相似度和所述负例对的第二相似度;根据所述第一相似度和所述第二相似度对所述比学习模型的损失函数进行优化,以更新所述对比学习模型,得到所述语义分析模型。4.根据权利要求3所述的疾病部位识别方法,其特征在于,在所述预先训练所述语义分析模型的步骤之前,所述方法还包括构建对比学习模型,具体包括:获取原始的预训练模型,其中,所述预训练模型为BERT模型,所述BERT模型包括BERT编码器;对预训练模型进行参数微调,以更新所述预训练模型,得到对比学习模型。5.根据权利要求1所述的疾病部位识别方法,其特征在于,所述通过预先训练的语义分析模型对所述原始病情文本进行语义分析处理,得到病情语义向量的步骤,包括:通过所述语义分析模型的嵌入层对所述原始病情文本进行数据预处理,得到标准病情文本;通过所述语义分析模型内的BERT编码器对所述标准病情文本进行编码处理,...
【专利技术属性】
技术研发人员:金晓辉,阮晓雯,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。