一种目标识别模型的建立方法、系统、电子设备及介质技术方案

技术编号：32332198 阅读：16 留言：0更新日期：2022-02-16 18:39

本发明专利技术适用于数据处理技术领域，提供了一种目标识别模型的建立方法、系统、电子设备及介质，所述方法包括：获取健康文本数据和健康音频数据，分别根据健康文本数据和健康音频数据获取文本特征和音频特征；采用注意力机制对文本特征和音频特征进行特征融合，形成融合特征数据集；采用多标签特征选择算法提取融合特征数据集的目标特征，形成样本数据集；采用样本数据集训练深度学习网络模型，经过前向传播后，分别获取已标注样本集的误差和未标注样本集的误差；对所述深度学习网络模型进行反向传播更新网络参数，得到目标识别模型；解决了基于健康数据建立的识别模型的识别准确度较低的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种目标识别模型的建立方法、系统、电子设备及介质

[0001]本专利技术涉及数据处理
，尤其涉及一种目标识别模型的建立方法、系统、电子设备及介质。

技术介绍

[0002]近年来人们生活水平逐渐提升，国民开始越来也注重自身身体健康，因此对医疗健康的需要也日渐增加。因此，利用健康文本信息、健康音频信息以及健康视频信息，譬如门诊档案及住院电子病历等资料进行必要的处理，从中获取有用的信息，在此基础上建立用于健康领域的识别模型也变得至关重要。健康领域对于数据的的保密性要求较高，其标注的语料也较少，识别模型需要大量的语料进行模型训练，因此基于健康数据建立的识别模型的识别准确性较低。此外，目标特征的提取是否准确，也对识别模型的准确度有影响；然而现有技术中目标特征多采用单标签，在此基础上建立的识别模型的识别准确性较低。

技术实现思路

[0003]本专利技术提供一种目标识别模型的建立方法、系统、电子设备及介质，以解决现有技术中基于健康数据建立的识别模型的识别准确度较低的问题。
[0004]本专利技术提供的目标识别模型的建立方法，包括：
[0005]获取健康文本数据和健康音频数据，分别根据所述健康文本数据和所述健康音频数据获取文本特征和音频特征；
[0006]采用注意力机制对所述文本特征和所述音频特征进行特征融合，形成融合特征数据集；
[0007]采用多标签特征选择算法提取所述融合特征数据集的目标特征，形成样本数据集，所述样本数据集包括已标注样本集和未标注样本集；
[0008...

【技术保护点】

【技术特征摘要】
1.一种目标识别模型的建立方法，其特征在于，所述方法包括：获取健康文本数据和健康音频数据，分别根据所述健康文本数据和所述健康音频数据获取文本特征和音频特征；采用注意力机制对所述文本特征和所述音频特征进行特征融合，形成融合特征数据集；采用多标签特征选择算法提取所述融合特征数据集的目标特征，形成样本数据集，所述样本数据集包括已标注样本集和未标注样本集；构建深度学习网络模型，采用所述样本数据集训练所述深度学习网络模型，经过前向传播后，分别获取所述已标注样本集的误差和所述未标注样本集的误差；根据所述已标注样本集的误差和所述未标注样本集的误差对所述深度学习网络模型进行反向传播更新所述深度学习网络模型的网络参数，得到目标识别模型。2.根据权利要求1所述的目标识别模型的建立方法，其特征在于，所述采用多标签特征选择算法提取所述融合特征数据集的目标特征，形成样本数据集，具体包括：采用多标签特征选择算法提取所述融合特征数据集的目标特征，获取多个第一标签向量；获取不同第一标签向量之间的相关度；根据预设相关度阈值和所述相关度获取第二标签向量，形成样本数据集。3.根据权利要求2所述的目标识别模型的建立方法，其特征在于，所述获取不同第一标签向量之间的相关度，具体包括：获取所述第一标签向量的信息熵；根据信息熵获取不同第一标签向量之间的互信息；根据所述信息熵和所述互信息获取不同标签向量之间的相关度。4.根据权利要求2所述的目标识别模型的建立方法，其特征在于，所述方法，还包括：获取所述目标特征的相对不确定性；根据所述相对不确定性获取候选特征；获取所述候选特征的对称不确定性，并根据所述对称不确定性更新第二标签向量，形成样本数据集。5.根据权利要求1所述的目标识别模型的建立方法，其特征在于，所述获取所述已标注样本集的误差和所述未标注样本集的误差，具体包括：采用交叉熵损失函数确定已标注样本集的误差；根据最小均方误差确定未标注样本集的误差。6.根据权利要求1所述的目标识别模型的建立方法，其特征在于，所述根据所述健康文本数据和所述健康音频数据获取文本特征和音频特征，具体包括：采用预设第一抽取模型提取所述健康文本数...

【专利技术属性】
技术研发人员：肖爽，陆静，
申请(专利权)人：重庆两江新区第一人民医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人