语音信息的处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号：28388445 阅读：11 留言：0更新日期：2021-05-08 00:18

本申请实施例公开了一种语音信息的处理方法、装置、存储介质及电子设备，该处理方法包括构建预设场景模型；训练生成场景识别模型；采集当前环境中的目标语音信息并分析得到相应的目标语谱图；将目标语谱图输入场景识别模型确定目标预设场景模型，并根据目标预设场景模型匹配相应的通话参数。提升了语音信息的处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音信息的处理方法、装置、存储介质及电子设备
本申请涉及电子设备
，尤其涉及一种语音信息的处理方法、装置、存储介质及电子设备。
技术介绍
随着电子技术的不断发展，电子设备如手机的功能越来越强大，用户对语音通话的要求也越来越高，用户在不同的通话场景下可以灵活选择相应的通话参数，从而实现更好的通话效果。目前，在手机处于通话状态时，手机可以实时采集当前通话环境中的语音信息，分析出语音信息中的嘈杂值，根据嘈杂值的大小相应调整通话音量的大小，实现通话音量随着通话环境的嘈杂度的变化而自动调节处理，但是只是根据语音信息中的嘈杂值对通话音量进行处理，处理方式较为单一，对通话场景的针对性较差，语音信息的处理效率低。
技术实现思路
本申请实施例提供一种语音信息的处理方法、装置、存储介质及电子设备，可以提升语音信息的处理效率。第一方面，本申请实施例了提供了一种语音信息的处理方法，包括：构建预设场景模型，所述预设场景模型中包括预设数量的语谱图；对所述预设场景模型中的语谱图进行训练，以生成相应的场景识别模型；采集当前环境中的目标语音信息，并对所述目标语音信息进行分析，以得到所述目标语音信息相应的目标语谱图；将所述目标语谱图输入场景识别模型，以确定相应的目标预设场景模型，并根据所述目标预设场景模型匹配相应的通话参数。第二方面，本申请实施例了提供了的一种语音信息的处理装置，包括：构建单元，用于构建预设场景模型，所述预设场景模型中包括预设数量的语谱图；训练单元，用于对...

【技术保护点】
一种语音信息的处理方法，其中，包括：/n构建预设场景模型，所述预设场景模型中包括预设数量的语谱图；/n对所述预设场景模型中的语谱图进行训练，以生成相应的场景识别模型；/n采集当前环境中的目标语音信息，并对所述目标语音信息进行分析，以得到所述目标语音信息相应的目标语谱图；/n将所述目标语谱图输入场景识别模型，以确定相应的目标预设场景模型，并根据所述目标预设场景模型匹配相应的通话参数。/n

【技术特征摘要】
【国外来华专利技术】一种语音信息的处理方法，其中，包括：
构建预设场景模型，所述预设场景模型中包括预设数量的语谱图；
对所述预设场景模型中的语谱图进行训练，以生成相应的场景识别模型；
采集当前环境中的目标语音信息，并对所述目标语音信息进行分析，以得到所述目标语音信息相应的目标语谱图；
将所述目标语谱图输入场景识别模型，以确定相应的目标预设场景模型，并根据所述目标预设场景模型匹配相应的通话参数。

如权利要求1所述的语音信息的处理方法，其中，所述构建预设场景模型的步骤，包括：
通过预设采样率采集预设数量的语音信息；
将所述预设数量的语音信息转化为相应的语谱图，根据所述语谱图构建预设场景模型。

如权利要求2所述的语音信息的处理方法，其中，所述将所述预设数量的语音信息转化为相应的语谱图的步骤，包括：
将所述语音信息进行分帧处理，以得到第一分帧数据；
对所述第一分帧数据进行傅里叶变换，生成语音信息相应的语谱图。

如权利要求1所述的语音信息的处理方法，其中，所述对所述预设场景模型中的语谱图进行训练，以生成相应的场景识别模型的步骤，包括：
采用卷积神经网络对进行预设场景模型中的语谱图进行训练，以生成相应的场景识别模型。

如权利要求1至4任一项所述的语音信息的处理方法，其中，所述对所述目标语音信息进行分析，以得到所述目标语音信息相应的目标语谱图的步骤，包括：
对所述目标语音信息进行分帧处理，以得到第二分帧数据；
对所述第二分帧数据进行傅里叶变换，以得到所述目标语音信息相应的目标语谱图。

如权利要求5所述的语音信息的处理方法，其中，所述将所述目标语谱图输入场景识别模型，以确定相应的目标预设场景模型的步骤，包括：
将所述目标语谱图输入场景识别模型；
通过场景识别模型对所述目标语谱图进行特征遍历，以确定该目标语谱图相应的目标预设场景模型。

如权利要求1所述的语音信息的处理方法，其中，所述根据所述目标预设场景模型匹配相应的通话参数的步骤之后，还包括：
生成相应的提示信息，以提示用户以匹配到的通话参数进行通话调节；
当接收到所述提示信息相应的确认指令时，根据匹配到通话参数进行通话调节。

一种语音信息的处理装置，其中，包括：
构建单元，用于构建预设场景模型，所述预设场景模型中包括预设数量的语谱图；
训练单元，用于对所述预设场景模型中的语谱图进行训练，以生成相应的场景识别模型；
分析单元，用于采集当前环境中的目标语音信息，并对所述目标语音信息进行分析，以得到所述目标语音信息相应的目标语谱图；
输入单元，用于将所述目标语谱图输入场景识别模型，以确定相应的目标预设场景模型，并根据所述目标预设场景模型匹配相应的通话参数。

如权利要求8所述的语音信息的处理装置，其中，所述构建单元，包括：
采集子单元，用于通过预设采样率采集预设数量的语音信息；
转化子单元，用于将所述预设数量的语音信息转化为相应的语谱图，根据所述语谱图构建预设场景模型。

如权利...

【专利技术属性】
技术研发人员：陈岩，
申请(专利权)人：深圳市欢太科技有限公司，OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人