基于语音交互的样本扩增方法、系统、设备及存储介质技术方案

技术编号：35475733 阅读：18 留言：0更新日期：2022-11-05 16:24

本发明专利技术公开了一种基于语音交互的样本扩增方法、系统、设备及存储介质，其中，所述方法包括：获取当前批次的真实图像样本集和用户语音数据；将随机噪声及所述真实图像样本集的特征类别输入至生成对抗网络中的生成模型，得到候选图像样本；对所述语音数据的语音语义以及所述候选图像样本的图像语义进行匹配，筛选出所述候选图像样本中符合预设条件的目标图像样本；通过所述生成对抗网络中的判别模型，对所述目标图像样本和所述真实图像样本集进行判别，得到判别结果；根据所述判别结果对所述生成模型和所述判别模型进行对抗训练，当满足训练停止条件时，输出当前批次的目标图像样本。通过上述方法能够生成更多高质量样本，以不断扩充样本库。不断扩充样本库。不断扩充样本库。

全部详细技术资料下载

【技术实现步骤摘要】
基于语音交互的样本扩增方法、系统、设备及存储介质

[0001]本专利技术涉及计算机
，特别涉及一种基于语音交互的样本扩增方法、系统、设备及存储介质。

技术介绍

[0002]在视觉检测领域，视觉检测算法对样本数量的依赖性非常强，但现有样本数据所存在的数量少、类别不均衡等问题使其难以支撑深度学习模型的训练需求，也大大限制了算法精度的提升。
[0003]因此，当前亟需一种样本扩增技术，能够解决样本稀缺问题。

技术实现思路

[0004]本专利技术为了解决现有技术存在的上述问题，提出了一种能够扩充高质量样本的样本扩增方法，更具体地，提供了一种基于语音交互的样本扩增方法、系统、设备及存储介质。
[0005]第一方面，本专利技术提供的一种基于语音交互的样本扩增方法包括：
[0006]获取当前批次的真实图像样本集和用户语音数据；
[0007]将随机噪声及所述真实图像样本集的特征类别输入至生成对抗网络中的生成模型，得到候选图像样本；
[0008]对所述语音数据的语音语义以及所述候选图像样本的图像语义进行匹配，筛选出所述候选图像样本中符合预设条件的目标图像样本；
[0009]通过所述生成对抗网络中的判别模型，对所述目标图像样本和所述真实图像样本集进行判别，得到判别结果；
[0010]根据所述判别结果对所述生成模型和所述判别模型进行对抗训练，当满足训练停止条件时，输出当前批次的目标图像样本。
[0011]作为进一步改进，所述方法还包括：
[001...

【技术保护点】

【技术特征摘要】
1.一种基于语音交互的样本扩增方法，其特征在于，包括：获取当前批次的真实图像样本集和用户语音数据；将随机噪声及所述真实图像样本集的特征类别输入至生成对抗网络中的生成模型，得到候选图像样本；对所述语音数据的语音语义以及所述候选图像样本的图像语义进行匹配，筛选出所述候选图像样本中符合预设条件的目标图像样本；通过所述生成对抗网络中的判别模型，对所述目标图像样本和所述真实图像样本集进行判别，得到判别结果；根据所述判别结果对所述生成模型和所述判别模型进行对抗训练，当满足训练停止条件时，输出当前批次的目标图像样本。2.根据权利要求1所述的方法，其特征在于，还包括：在当前批次中，将输出的目标图像样本增加至所述真实图像样本集中，得到下一批次的真实图像样本集。3.根据权利要求1所述的方法，其特征在于，所述根据所述判别结果对所述生成模型和所述判别模型进行对抗训练，包括：固定所述生成模型的网络参数，采用判别损失函数对所述判别模型的网络参数进行训练，得到训练后的判别模型；固定训练后的判别模型的网络参数，基于生成损失函数，采用强化学习策略对所述生成模型的网络参数进行迭代训练，得到训练后的生成模型。4.根据权利要求1所述的方法，其特征在于，所述对所述语音数据的语音语义以及所述候选图像样本的图像语义进行匹配，筛选出所述候选图像样本中符合预设条件的目标图像样本，包括：利用协同矩阵分解学习所述候选图像样本和所述语音数据的模态间语义一致性，基于模态间语义一致性对所述语音数据的语音语义和所述候选图像样本的图像语义进行相似性匹配；根据匹配结果筛选出所述候选图像样本中符合预设条件的目标图像样本。5.根据权利要求4所述的方法，其特征在于，所述利用协同矩阵分解学习所述候选图像样本和所述语音数据的模态间语义一致性，包括：通过协同矩阵分解分别得...

【专利技术属性】
技术研发人员：杜翠凤，
申请(专利权)人：广州杰赛通信规划设计院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人