一种语音处理方法、语音处理装置和可读存储介质制造方法及图纸

技术编号：42831200 阅读：46 留言：0更新日期：2024-09-24 21:05

本发明专利技术实施例提供了一种语音处理方法、语音处理装置和可读存储介质。所述方法应用于第一端设备，所述方法包括：利用训练完成的语音情感识别模型对第一语音进行情感识别，得到所述第一语音对应的第一情感类别；所述语音情感识别模型为基于声音事件检测和语音情感识别的多任务模型训练得到，所述第一语音来自所述第一端设备；在接收到第二语音时，基于第二情感类别对所述第二语音进行情感转换，并播放转换后的第二语音，所述第二情感类别根据所述第一情感类别确定，所述第二语音来自第二端设备。本发明专利技术实施例可以提高双方语音通话的效果和体验，以及提高语音情感识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能网络摄像头，尤其涉及一种语音处理方法、语音处理装置和可读存储介质。

技术介绍

1、智能网络摄像头，是一种结合传统摄像机与网络技术所产生的新一代摄像机。除了具备一般传统摄像机所具有的图像捕捉功能外，机内还内置了数字化压缩控制器和基于web(world wide web，全球广域网)的操作系统，使得视频数据经压缩加密后，通过局域网、因特网或无线网络送至远端用户。远端用户可通过移动终端(如手机)对网络摄像机进行访问，实时监控现场的情况，可以满足用户远程看家看店、看护老人孩童、看护宠物等家用需求。

2、智能网络摄像头采用双向全双工语音技术，手机端和智能网络摄像头端的用户可实现双向语音通话。

技术实现思路

1、本专利技术实施例提供一种语音处理方法、语音处理装置和可读存储介质，可以提高双方语音通话的效果和体验，以及提高语音情感识别的准确性。

2、第一方面，本专利技术实施例公开了一种语音处理方法，应用于第一端设备，所述方法包括：

3、利用训练完成的语...

【技术保护点】

1.一种语音处理方法，其特征在于，应用于第一端设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述利用所述第一训练数据集和所述第二训练数据集对所述多任务模型进行迭代训练，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于第二情感类别对所述第二语音进行情感转换，包括：

5.根据权利要求4所述的方法，其特征在于，所述训练完成的情感语音转换模型包括编码器和解码器；所述将所述第二情感类别和所述第二语音输入训练完成的情感语音转换模型，通过所述情感语音转换模型输出转换后...

【技术特征摘要】

1.一种语音处理方法，其特征在于，应用于第一端设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述利用所述第一训练数据集和所述第二训练数据集对所述多任务模型进行迭代训练，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于第二情感类别对所述第二语音进行情感转换，包括：

5.根据权利要求4所述的方法，其特征在于，所述训练完成的情感语音转换模型包括编码器和解码器；所述将所述第二情感类别和所述第二语音输入训练完成的情感语音转换模型，通过所述情感语音转换模...

【专利技术属性】
技术研发人员：尹旭贤，艾国，杨作兴，
申请(专利权)人：深圳比特微电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人