证型推荐方法、装置、电子设备及非易失性存储介质制造方法及图纸

技术编号:36433942 阅读:16 留言:0更新日期:2023-01-20 22:47
本申请公开了一种证型推荐方法、装置、电子设备及非易失性存储介质。其中,该方法包括:获取原始文本信息,其中,原始文本信息包括:问诊文本信息和病历文本信息;依据预训练模型,对原始文本信息进行向量化处理,得到目标向量数据,其中,目标向量数据包括:问诊向量数据和病历向量数据;采用第一神经网络对病历向量数据进行特征提取,得到第一特征数据,以及采用第二神经网络对问诊向量数据进行特征提取,得到第二特征数据;依据第一特征数据和第二特征数据,确定目标证型。本申请解决了由于目前的中医辨证系统大多未采用自然语言处理技术,造成辨证系统的证型推荐准确率差的技术问题。成辨证系统的证型推荐准确率差的技术问题。成辨证系统的证型推荐准确率差的技术问题。

【技术实现步骤摘要】
证型推荐方法、装置、电子设备及非易失性存储介质


[0001]本申请涉及智能推荐领域,具体而言,涉及一种证型推荐方法、装置、电子设备及非易失性存储介质。

技术介绍

[0002]在中医领域,“证”是疾病周期或发展过程中的某个阶段特征(或症状)的反应和概括。辨证是是中医学对疾病的一种特殊的研究方法,他是中医治疗疾病的关键,辨证是利用望闻问切所收集到的患者症状和体征信息,辨清患者的发病原因、病理位置和病邪性质等,最后判断为某种性质的证型,然而,由于疾病和证候的复杂多样,加之医者水平、学术流派等影响,传统的辨证方法,往往需要中医专家积累的临床经验,才能达到较好的辨病效果。
[0003]随着人工智能技术的兴起,一些用于辅助医生进行疾病诊断的中医辨证系统也随之出现,然而,目前的中医辨证系统大多未采用自然语言处理技术,造成辨证系统的可靠性不高,往往存在证型推荐准确率差的问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种证型推荐方法、装置、电子设备及非易失性存储介质,以至少解决由于目前的中医辨证系统大多未采用自然语言处理技术,造成辨证系统的证型推荐准确率差的技术问题。
[0006]根据本申请实施例的一个方面,提供了一种证型推荐方法,包括:获取原始文本信息,其中,原始文本信息包括:问诊文本信息和病历文本信息;依据预训练模型,对原始文本信息进行向量化处理,得到目标向量数据,其中,目标向量数据包括:问诊向量数据和病历向量数据,问诊向量数据为对问诊文本信息进行向量化处理后得到的目标向量数据,病历向量数据为对病历文本信息进行向量化处理后得到的目标向量数据;采用第一神经网络对病历向量数据进行特征提取,得到第一特征数据,以及采用第二神经网络对问诊向量数据进行特征提取,得到第二特征数据;依据第一特征数据和第二特征数据,确定目标证型。
[0007]可选地,依据预训练模型,对原始文本信息进行向量化处理,得到目标向量数据包括:确定原始文本信息中的每个词的词向量;确定原始文本信息中词向量所在句子的句子向量;确定词向量对应的位置向量,其中,位置向量用于表征词向量在句子中的位置信息;将词向量、句子向量及位置向量输入预训练模型进行处理,得到目标向量数据。
[0008]可选地,将词向量、句子向量及位置向量输入预训练模型进行处理之前还包括:获取预训练文本信息,其中,预训练文本信息所述预训练文本信息从中医知识库中获取,所述中医知识库中存储有用于记录中医知识的文本信息;按照预设概率选择预训练文本信息中的词语进行遮盖;依据预训练文本信息中被遮盖的词语和未被遮盖的词语,对初始模型进行训练,得到预训练模型。
[0009]可选地,采用第一神经网络对病历向量数据进行特征提取,得到第一特征数据,以
及采用第二神经网络对问诊向量数据进行特征提取,得到第二特征数据包括:对病历向量数据进行卷积化处理;确定第一神经网络对应的激活函数和第一最大池化函数;依据激活函数和第一最大池化函数,对卷积化处理后的病历向量数据进行计算,得到第一特征数据;依据第二神经网络,对问诊向量数据进行特征提取,得到第二特征数据。
[0010]可选地,依据第二神经网络,对问诊向量数据进行特征提取,得到第二特征数据包括:依据问诊向量数据,建立目标关系图,其中,目标关系图用于表征问诊向量数据中词向量之间的关系;确定目标关系图对应的目标邻接矩阵和目标训练参数;依据目标邻接矩阵和目标训练参数,计算问诊向量数据中词向量的影响系数,其中,影响系数用于表征词向量对问诊向量数据中其余词向量的影响程度;依据影响系数和第二最大池化函数,确定第二特征数据。
[0011]可选地,依据第一特征数据和第二特征数据,确定目标证型包括:依据第一特征数据、第二特征数据及目标分类器,计算各个证型的置信度;确定置信度最高的证型为目标证型。
[0012]可选地,依据第一特征数据、第二特征数据及目标分类器,计算各个证型的置信度之前还包括:获取训练数据,其中,训练数据包括:特征数据、证型以及特征数据与证型的对应关系;依据训练数据,确定特征数据和证型之间的目标关联关系;依据目标关联关系,生成目标分类器。
[0013]根据本申请实施例的另一个方面,还提供了一种证型推荐装置,包括:数据采集模块,用于获取原始文本信息,其中,原始文本信息包括:问诊文本信息和病历文本信息;向量化模块,用于依据预训练模型,对原始文本信息进行向量化处理,得到目标向量数据,其中,目标向量数据包括:问诊向量数据和病历向量数据,问诊向量数据为对问诊文本信息进行向量化处理后得到的目标向量数据,病历向量数据为对病历文本信息进行向量化处理后得到的目标向量数据;特征提取模块,用于采用第一神经网络对病历向量数据进行特征提取,得到第一特征数据,以及采用第二神经网络对问诊向量数据进行特征提取,得到第二特征数据;证型推荐模块,用于依据第一特征数据和第二特征数据,确定目标证型。
[0014]根据本申请实施例的又一方面,还提供了一种电子设备,电子设备包括处理器,处理器用于运行程序,其中,程序运行时执行证型推荐方法。
[0015]根据本申请实施例的再一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的计算机程序,其中,非易失性存储介质所在设备通过运行计算机程序执行证型推荐方法。
[0016]在本申请实施例中,采用获取原始文本信息,其中,原始文本信息包括:问诊文本信息和病历文本信息;依据预训练模型,对原始文本信息进行向量化处理,得到目标向量数据,其中,目标向量数据包括:问诊向量数据和病历向量数据,问诊向量数据为对问诊文本信息进行向量化处理后得到的目标向量数据,病历向量数据为对病历文本信息进行向量化处理后得到的目标向量数据;采用第一神经网络对病历向量数据进行特征提取,得到第一特征数据,以及采用第二神经网络对问诊向量数据进行特征提取,得到第二特征数据;依据第一特征数据和第二特征数据,确定目标证型的方式,通过增加预训练模型,以及对不同类型的原始文本数据应用不同的神经网络,达到了保证辨证系统可靠性,提升辨证准确率的目的,进而解决了由于目前的中医辨证系统大多未采用自然语言处理技术,造成辨证系统
的证型推荐准确率差的技术问题。
附图说明
[0017]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0018]图1是根据本申请实施例提供的一种证型推荐的方法流程的示意图;
[0019]图2是根据本申请实施例提供的一种预训练模型的结构示意图;
[0020]图3是根据本申请实施例提供的一种预训练模型中对文本信息进行向量化处理的过程的示意图;
[0021]图4是根据本申请实施例提供的一种第一神经网络的框架结构示意图;
[0022]图5是根据本申请实施例提供的一种第二神经网络的框架结构示意图;
[0023]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种证型推荐方法,其特征在于,包括:获取原始文本信息,其中,所述原始文本信息包括:问诊文本信息和病历文本信息;依据预训练模型,对所述原始文本信息进行向量化处理,得到目标向量数据,其中,所述目标向量数据包括:问诊向量数据和病历向量数据,所述问诊向量数据为对所述问诊文本信息进行向量化处理后得到的所述目标向量数据,所述病历向量数据为对所述病历文本信息进行向量化处理后得到的所述目标向量数据;采用第一神经网络对所述病历向量数据进行特征提取,得到第一特征数据,以及采用第二神经网络对所述问诊向量数据进行特征提取,得到第二特征数据;依据所述第一特征数据和第二特征数据,确定目标证型。2.根据权利要求1所述的证型推荐方法,其特征在于,依据预训练模型,对所述原始文本信息进行向量化处理,得到目标向量数据包括:确定所述原始文本信息中的每个词的词向量;确定所述原始文本信息中所述词向量所在句子的句子向量;确定所述词向量对应的位置向量,其中,所述位置向量用于表征所述词向量在所述句子中的位置信息;将所述词向量、句子向量及所述位置向量输入所述预训练模型进行处理,得到所述目标向量数据。3.根据权利要求2所述的证型推荐方法,其特征在于,将所述词向量、句子向量及所述位置向量输入所述预训练模型进行处理之前还包括:获取预训练文本信息,其中,所述预训练文本信息从中医知识库中获取,所述中医知识库中存储有用于记录中医知识的文本信息;按照预设概率选择所述预训练文本信息中的词语进行遮盖;依据所述预训练文本信息中被遮盖的词语和未被遮盖的词语,对初始模型进行训练,得到所述预训练模型。4.根据权利要求1所述的证型推荐方法,其特征在于,采用第一神经网络对所述病历向量数据进行特征提取,得到第一特征数据,以及采用第二神经网络对所述问诊向量数据进行特征提取,得到第二特征数据包括:对所述病历向量数据进行卷积化处理;确定所述第一神经网络对应的激活函数和第一最大池化函数;依据所述激活函数和第一最大池化函数,对所述卷积化处理后的病历向量数据进行计算,得到所述第一特征数据;依据所述第二神经网络,对所述问诊向量数据进行特征提取,得到所述第二特征数据。5.根据权利要求4所述的证型推荐方法,其特征在于,依据所述第二神经网络,对所述问诊向量数据进行特征提取,得到所述第二...

【专利技术属性】
技术研发人员:周晓华黄新霆陈力
申请(专利权)人:北京大学重庆大数据研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1