【技术实现步骤摘要】
一种语音处理方法、装置、设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种语音处理方法、装置、设备及存储介质。
技术介绍
[0002]目前对于语音情感分析大多都使用通用模型,例如找一些发音人采用多种情感进行发音,利用采集的发音数据训练模型,达到识别其他人语音情感的目的。针对一些识别准确率不太高的情况,有一些研究者会结合说话人的其他信息(例如表情、语音文本等)来一起得出结果,但这种方案需要的成本比较高,而且每个人都有自己的一套语音情感的表达体系,有时候只是单纯的发音比较大声,但通用模型大概率会分类到愤怒、激动。因此,如何提升语音情感识别的准确性是亟待解决的问题。
技术实现思路
[0003]本申请实施例提供了一种语音处理方法、装置、设备及存储介质,可以提升语音情感识别的准确性。
[0004]一方面,本申请实施例提供了一种语音处理方法,所述方法包括:
[0005]获取目标应用场景的待处理语音数据,并基于语音情感识别模型确定所述待处理语音数据的情感识别结果集合,所述情感识别结果集合包括 ...
【技术保护点】
【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:获取目标应用场景的待处理语音数据,并基于语音情感识别模型确定所述待处理语音数据的情感识别结果集合,所述情感识别结果集合包括所述待处理语音数据的多个语音片段中每个语音片段所属的情感类别;若所述情感识别结果集合未满足所述目标应用场景的场景规则,则对所述多个语音片段进行聚类处理,得到多个聚类簇,所述场景规则包括预定义的各个参考情感类别的占比规则,同一个聚类簇中的语音片段对应一种情感类别;从所述多个聚类簇中确定情感类别与所述目标应用场景不匹配的第一聚类簇,并获取所述第一聚类簇对应的情感标注标签;基于所述第一聚类簇对应的情感标注标签和所述情感识别结果集合,确定所述待处理语音数据的情感评价结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述情感识别结果集合中不同情感类别对应的语音片段占比;若所述情感识别结果集合中存在一情感类别对应的语音片段占比未满足对应的参考情感类别的占比规则,则确定所述情感识别结果集合未满足所述目标应用场景的场景规则。3.根据权利要求1所述的方法,其特征在于,所述从所述多个聚类簇中确定对应的情感类别与所述目标应用场景不匹配的第一聚类簇,包括:基于所述多个聚类簇中的任一聚类簇中不同情感类别对应的语音片段占比,确定对应最大语音片段占比的情感类别,并将所述对应最大语音片段占比的情感类别确定为所述任一聚类簇对应的情感类别;获取与所述目标应用场景匹配的正向情感类别;若所述任一聚类簇对应的情感类别不是所述与所述目标应用场景匹配的正向情感类别,则确定所述任一聚类簇为情感类别与所述目标应用场景不匹配的第一聚类簇。4.根据权利要求1
‑
3中任一项所述的方法,其特征在于,所述对所述多个语音片段进行聚类处理,得到多个聚类簇,包括:确定所述多个语音片段中每个语音片段的语音特征,并基于所述每个语音片段的语音特征以及目标期望数量,对所述多个语音片段进行聚类处理,得到至少一个聚类簇,所述至少一个聚类簇的数量为所述目标期望数量;获取所述至少一个聚类簇中的每个聚类簇的语音片段总量,并将对应语音片段总量小于预设总量的聚类簇确定为第二聚类簇;若所述第二聚类簇的数量小于预设数量,则基于所述每个聚类簇中不同情感类别对应的语音片段占比,确定所述每个聚类簇对应的最大语音片段占比,一个聚类簇对应的最大语音片段占比为在所述一个聚类簇中占比最大的情感类别对应的语音片段占比;若所述至少一个聚类簇中的各个聚类簇对应的最大语音片段占比大于预设占比,则将所述至少一个聚类簇中除所述第二聚类簇以外的聚类簇,确定为多个聚类簇。5.根据权利要求4所述的方法,其特征在于,所述目标期望数量为第一数量;所述方法还包括:若所述第二聚类簇的数量大于或者等于所述预设数量,则将所述目标期望数量更新为
第二数量,执行...
【专利技术属性】
技术研发人员:张欢韵,
申请(专利权)人:深圳华策辉弘科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。