【技术实现步骤摘要】
意图识别模型的训练方法、装置、计算机设备和存储介质
本申请涉及人工智能
,具体涉及一种意图识别模型的训练方法、装置、计算机设备和存储介质。
技术介绍
目前智能客服系统已经应用在各个领域,包括金融领域,电商领域、通信领域等等。在客服与客户的对话过程中,客户有可能在不经意间透露包含敏感信息的内容,如何确定客户在对话过程中的语音是否具有敏感内容,成为了一个亟需解决的问题。随着深度学习的流行,基于神经网络模型的方法已经成为主流的敏感内容检测方法,即采用预训练的识别模型识别出客户在对话中输入的语音的意图,再基于意图判别出该语音中是否存在敏感内容。然而,由于客户绝大多数时间说的都是正常内容的语音,只有极少部分为带有敏感内容的语音,从而导致用于训练生成识别模型的正负样本存在类别不平衡的问题,进而使得训练生成的识别模型的泛化能力较差,且生成的模型的意图预测效果较差。
技术实现思路
本申请的主要目的为提供一种意图识别模型的训练方法、装置、计算机设备和存储介质,旨在解决现有的用于训练生成识别模型的正负样本存在类别不平衡 ...
【技术保护点】
1.一种意图识别模型的训练方法,其特征在于,包括:/n基于历史通话录音数据获取敏感文本以及正常文本,其中,所述敏感文本为包含敏感内容的文本,所述正常文本为不包含敏感内容的文本,且所述敏感文本与所述正常文本携带有对应的意图标签;/n基于随机马赛克处理的方式,按照预设规则对所述敏感文本进行文本扩充处理,得到扩充后的敏感文本,以使所述扩充后的敏感文本的第一数量与所述正常文本的第二数量之间的比值等于预设比值,其中,所述随机马赛克处理是指以预设概率对文本中的每个字使用特殊符号进行替换处理;/n对所述扩充后的敏感文本中除所述敏感文本外的其他文本进行标注处理,得到对应的指定敏感文本,以使 ...
【技术特征摘要】
1.一种意图识别模型的训练方法,其特征在于,包括:
基于历史通话录音数据获取敏感文本以及正常文本,其中,所述敏感文本为包含敏感内容的文本,所述正常文本为不包含敏感内容的文本,且所述敏感文本与所述正常文本携带有对应的意图标签;
基于随机马赛克处理的方式,按照预设规则对所述敏感文本进行文本扩充处理,得到扩充后的敏感文本,以使所述扩充后的敏感文本的第一数量与所述正常文本的第二数量之间的比值等于预设比值,其中,所述随机马赛克处理是指以预设概率对文本中的每个字使用特殊符号进行替换处理;
对所述扩充后的敏感文本中除所述敏感文本外的其他文本进行标注处理,得到对应的指定敏感文本,以使所述其他文本携带对应的意图标签;
将所述指定敏感文本与所述正常文本作为训练样本,并获取与所述训练样本对应的上下文文本数据;
将所述训练样本以及与所述训练样本对应的上下文文本数据作为预设的初始意图识别模型的输入,以与所述训练样本对应的意图标签作为所述初始意图识别模型的输出,对所述初始意图识别模型进行训练,得到训练完成的第一意图识别模型;
获取预设的测试样本数据,将所述测试样本数据输入至所述第一意图识别模型,接收所述第一意图识别模型输出的与所述测试样本数据对应的识别结果;
基于所述识别结果对所述第一意图识别模型进行验证,判断是否验证通过;
若验证通过,将所述第一意图识别模型作为目标意图识别模型,以通过所述目标意图识别模型对新输入的客户对话文本数据进行意图识别。
2.根据权利要求1所述的意图识别模型的训练方法,其特征在于,所述基于随机马赛克处理的方式,按照预设规则对所述敏感文本进行文本扩充处理,得到扩充后的敏感文本,以使所述扩充后的敏感文本的第一数量与所述正常文本的第二数量之间的比值等于预设比值的步骤,包括:
获取所述敏感文本的第三数量;
计算所述第三数量与所述第一数量的差值,得到第四数量;
采用随机马赛克处理的方式对所述敏感文本进行处理,基于所述敏感文本生成与所述第四数量相同的多个第一敏感文本;
使用所述第一敏感文本对所述敏感文本进行扩充处理,得到所述扩充后的敏感文本。
3.根据权利要求2所述的意图识别模型的训练方法,其特征在于,所述基于随机马赛克处理的方式,按照预设规则对所述敏感文本进行文本扩充处理,得到扩充后的敏感文本,以使所述扩充后的敏感文本的第一数量与所述正常文本的第二数量之间的比值等于预设比值的步骤,包括:
获取预设文本,其中,所述预设文本为无意义的文本;
使用所述预设文本对所述敏感文本进行拼接处理,得到拼接后的第二敏感文本;
采用随机马赛克处理的方式对所述第二敏感文本进行处理,基于所述第二敏感文本生成与所述第四数量相同的多个第三敏感文本;
使用所述第三敏感文本对所述敏感文本进行扩充处理,得到所述扩充后的敏感文本。
4.根据权利要求2所述的意图识别模型的训练方法,其特征在于,所述基于随机马赛克处理的方式,按照预设规则对所述敏感文本进行文本扩充处理,得到扩充后的敏感文本,以使所述扩充后的敏感文本的第一数量与所述正常文本的第二数量之间的比值等于预设比值的步骤,包括:
获取预设敏感文本,其中,所述预设敏感文本为所有所述敏感文本中的任意一个文本;
从所有所述敏感文本中筛选出与所述预设敏感文本具有相同的意图标签的同类敏感文本;
使用所述同类敏感文本对所述预设敏感文本进行拼接处理,得到拼接后的第四敏感文本;
采用随机马赛克处理的方式对所述第四敏感文本进行处理,基于所述第四敏感文本生成与所述第四数量相同的多个第五敏感文本;
使用所述第五敏感文本对所述敏感文本进行扩充处理,得到所述扩充后的敏感文本。
5.根据权利要求1所述的意图识别模型的训练方法,其特征在于,所述将所述训练样本以及与所述训练样本对应的上下文文本数据作为预设的初始意图识别模型的输入,以与所述训练样本对应的意图标签作为所述初始意图识别模型的输出,对所述初始意图识别模型进行训练,得到训练完成的第一意图识别模型的步骤,包括:
将所述训练样本输入至所述初始意图识别模型中的嵌入层,通过所述嵌入层对所述训练样本进行编码处理,将所述训练样本转换为对应的第一特征向量;
将所述第一特征向量作为所述初始意图识别模型中的卷积神经网络层的输入,通过所述卷积神经网络层对所述第一特征向量进行卷积处理后生成对应的第二特征向量;
将所述第二特征向量作为所述初始意图识别模型中的最大池化层的输入,通过所述最大池化层对所述第二特征向量进行池化处理后生成对应的第三特...
【专利技术属性】
技术研发人员:左彬靖,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。