情绪识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:37990060 阅读:9 留言:0更新日期:2023-06-30 10:04
本发明专利技术实施例公开了情绪识别方法、装置、计算机设备及存储介质。所述方法包括:获取智能外呼机器人的对话内容;将所述对话内容输入至情绪识别模型进行情绪识别,以得到识别结果;其中,所述情绪识别模型是通过若干客户话术作为样本集以及话术库,利用话术库扩充样本集,利用样本集对不同分类模型进行训练所得的。通过实施本发明专利技术实施例的方法可实现适用于智能外呼机器人,准确率高,交互体验感强。交互体验感强。交互体验感强。

【技术实现步骤摘要】
情绪识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及计算机,更具体地说是指情绪识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]互联网技术和信息技术的飞速发展导致了信息资源的急剧增长,从而引起严重的信息过载问题,如何从海量的文本数据中挖掘出隐含的有用信息引起人们越来越多的关注,自然语言处理技术由此产生。情绪识别是自然语言处理方向的一个基础任务,也是“智能产品”的一个基本功能——能够感知人的情绪变化。
[0003]现有的情感分析方法分为基于情感词典的情感分析方法、基于传统机器学习的情感分析方法以及基于深度学习的情感分析方法。基于情感词典的方法是指根据不同情感词典所提供的情感词的情感极性,来实现不同粒度下的情感极性划分,可以准确反映文本的非结构化特征,易于分析和理解,但基于情感词典的情感分类方法主要依赖于情感词典的构建,情感词典中的同一情感词可能在不同时间、不同语言或不同领域中所表达的含义不同,因此基于情感词典的方法在跨领域和跨语言中的效果不是很理想;在使用情感词典进行情感分类时,往往考虑不到上下文之间的语义关系。基于机器学习和深度学习的情感分析方法是指通过大量有标注和无标注的语料,训练模型进行情感识别输出结果,对不同领域存在冷启动困难的问题,语料收集标注整理需要投入大量的人力。
[0004]随着AI技术的大力发展,智能外呼机器人在产业界已经逐渐变得成熟,越来越多的企业开始使用智能外呼机器人,提高通知、核销、营销效率,节约人工客服成本。目前成熟的智能外呼机器人基于固定流程进行交互,流程走向通过情绪识别结果控制,因此情绪识别的效果决定了智能外呼机器人智能化水平。但现有情绪识别方法存在跨领域模型泛化能力差,无法快速利用大量无标签数据的问题,导致特定领域情感识别存在准确率低、交互体验差、客户服务满意度下降、运营维护成本高等问题。
[0005]因此,有必要设计一种新的方法,实现适用于智能外呼机器人,准确率高,交互体验感强。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的缺陷,提供情绪识别方法、装置、计算机设备及存储介质。
[0007]为实现上述目的,本专利技术采用以下技术方案:情绪识别方法,包括:
[0008]获取智能外呼机器人的对话内容;
[0009]将所述对话内容输入至情绪识别模型进行情绪识别,以得到识别结果;
[0010]其中,所述情绪识别模型是通过若干客户话术作为样本集以及话术库,利用话术库扩充样本集,利用样本集对不同分类模型进行训练所得的。
[0011]其进一步技术方案为:所述情绪识别模型是通过若干客户话术作为样本集以及话
术库,利用话术库扩充样本集,利用样本集对不同分类模型进行训练所得的,包括:
[0012]获取对话日志,并根据所述对话日志确定样本集以及话术库;
[0013]将所述样本集按比例分为训练数据和测试数据样本集合;
[0014]确定分类算法;
[0015]利用所述样本集训练所述分类算法,以得到分类模型、分类模型的召回率和精确率的相关分数;
[0016]判断所述话术库是否是无可采样样本;
[0017]若所述话术库不是无可采样样本,则判断所述话术库内的样本数量是否小于预设数值;
[0018]若所述话术库内的样本数量不小于预设数值,则从所述话术库中无放回抽取样本得到待识别话术库,利用样本集训练的所述分类模型对所述待识别话术库进行识别,以得到每条话术所属的类别以及置信度;
[0019]根据每条话术所属的类别以及置信度扩充所述样本集,并执行所述利用所述样本集训练所述分类算法,以得到分类模型、分类模型的召回率和精确率的相关分数;
[0020]若所述话术库是无可采样样本,则确定所述相关分数最高的分类模型,以得到情绪识别模型。
[0021]其进一步技术方案为:所述判断所述话术库内的样本数量是否小于预设数值之后,还包括:
[0022]若所述话术库内的样本数量小于预设数值,则执行所述确定所述相关分数最高的分类模型,以得到情绪识别模型。
[0023]其进一步技术方案为:所述获取对话日志,并根据所述对话日志确定样本集以及话术库,包括:
[0024]使用领域内开源无标注语料训练领域语言模型;
[0025]获取对话日志,从所述对话日志中提取出客户话术;
[0026]利用所述领域语言模型判断所述客户话术是否是正常话术;
[0027]若所述客户话术不是正常话术,则舍弃所述客户话术;
[0028]若所述客户话术是正常话术,则将所述客户话术存入话术库,记录所述客户话术出现的次数;
[0029]确定所述话术库内的客户话术的情感识别类别集合;
[0030]从所述话术库抽取数据进行标注,以得到样本集。
[0031]其进一步技术方案为:所述确定分类算法,包括:
[0032]选择不同的分类算法作为基础算法;
[0033]利用所述训练数据训练所述基础算法,并计算每个基础算法的F值,以确定F基础值以及分类模型。
[0034]其进一步技术方案为:所述从所述话术库中无放回抽取样本得到待识别话术库,利用样本集训练的所述分类模型对所述待识别话术库进行识别,以得到每条话术所属的类别以及置信度,包括:
[0035]计算所述话术库的样本抽样权重、采样数量以及随机采样阈值;
[0036]随机从话术库抽取样本,生成一个随机数,当随机数乘以样本抽样权重大于随机
采样阈值时,选取所述样本存入待识别话术库中;
[0037]将所述样本从话术库删除;
[0038]利用样本集训练的所述分类模型对所述待识别话术库进行识别,以得到每条话术所属的类别以及置信度。
[0039]其进一步技术方案为:所述根据每条话术所属的类别以及置信度扩充所述样本集,包括:
[0040]当所述话术的置信度大于第一设定阈值时,将所述话术放入所述样本集内,并记录所述话术所属的类别;当所述话术的置信度小于第二设定阈值时,舍弃所述话术;当所述话术的置信度不大于第一设定阈值且不小于第二设定阈值时,将所述话术放回所述话术库内。
[0041]本专利技术还提供了情绪识别装置,包括:
[0042]内容获取单元,用于获取智能外呼机器人的对话内容;
[0043]识别单元,用于将所述对话内容输入至情绪识别模型进行情绪识别,以得到识别结果。
[0044]本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
[0045]本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0046]本专利技术与现有技术相比的有益效果是:本专利技术通过使用多种算法组建的多种模型,采用样本集进行训练,且利用话术库进行样本集的扩充,只需少量情感标注数据就可以不断自学习迭本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.情绪识别方法,其特征在于,包括:获取智能外呼机器人的对话内容;将所述对话内容输入至情绪识别模型进行情绪识别,以得到识别结果;其中,所述情绪识别模型是通过若干客户话术作为样本集以及话术库,利用话术库扩充样本集,利用样本集对不同分类模型进行训练所得的。2.根据权利要求1所述的情绪识别方法,其特征在于,所述情绪识别模型是通过若干客户话术作为样本集以及话术库,利用话术库扩充样本集,利用样本集对不同分类模型进行训练所得的,包括:获取对话日志,并根据所述对话日志确定样本集以及话术库;将所述样本集按比例分为训练数据和测试数据样本集合;确定分类算法;利用所述样本集训练所述分类算法,以得到分类模型、分类模型的召回率和精确率的相关分数;判断所述话术库是否是无可采样样本;若所述话术库不是无可采样样本,则判断所述话术库内的样本数量是否小于预设数值;若所述话术库内的样本数量不小于预设数值,则从所述话术库中无放回抽取样本得到待识别话术库,利用样本集训练的所述分类模型对所述待识别话术库进行识别,以得到每条话术所属的类别以及置信度;根据每条话术所属的类别以及置信度扩充所述样本集,并执行所述利用所述样本集训练所述分类算法,以得到分类模型、分类模型的召回率和精确率的相关分数;若所述话术库是无可采样样本,则确定所述相关分数最高的分类模型,以得到情绪识别模型。3.根据权利要求2所述的情绪识别方法,其特征在于,所述判断所述话术库内的样本数量是否小于预设数值之后,还包括:若所述话术库内的样本数量小于预设数值,则执行所述确定所述相关分数最高的分类模型,以得到情绪识别模型。4.根据权利要求2所述的情绪识别方法,其特征在于,所述获取对话日志,并根据所述对话日志确定样本集以及话术库,包括:使用领域内开源无标注语料训练领域语言模型;获取对话日志,从所述对话日志中提取出客户话术;利用所述领域语言模型判断所述客户话术是否是正常话术;若所述客户话术不是正常话术,则舍弃所述客户话术;若所述客户...

【专利技术属性】
技术研发人员:高鹏钱艳袁兰吴飞周伟华高峰潘晶
申请(专利权)人:杭州摸象大数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1