语音信息的处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:28388445 阅读:11 留言:0更新日期:2021-05-08 00:18
本申请实施例公开了一种语音信息的处理方法、装置、存储介质及电子设备,该处理方法包括构建预设场景模型;训练生成场景识别模型;采集当前环境中的目标语音信息并分析得到相应的目标语谱图;将目标语谱图输入场景识别模型确定目标预设场景模型,并根据目标预设场景模型匹配相应的通话参数。提升了语音信息的处理效率。

【技术实现步骤摘要】
【国外来华专利技术】语音信息的处理方法、装置、存储介质及电子设备
本申请涉及电子设备
,尤其涉及一种语音信息的处理方法、装置、存储介质及电子设备。
技术介绍
随着电子技术的不断发展,电子设备如手机的功能越来越强大,用户对语音通话的要求也越来越高,用户在不同的通话场景下可以灵活选择相应的通话参数,从而实现更好的通话效果。目前,在手机处于通话状态时,手机可以实时采集当前通话环境中的语音信息,分析出语音信息中的嘈杂值,根据嘈杂值的大小相应调整通话音量的大小,实现通话音量随着通话环境的嘈杂度的变化而自动调节处理,但是只是根据语音信息中的嘈杂值对通话音量进行处理,处理方式较为单一,对通话场景的针对性较差,语音信息的处理效率低。
技术实现思路
本申请实施例提供一种语音信息的处理方法、装置、存储介质及电子设备,可以提升语音信息的处理效率。第一方面,本申请实施例了提供了一种语音信息的处理方法,包括:构建预设场景模型,所述预设场景模型中包括预设数量的语谱图;对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型;采集当前环境中的目标语音信息,并对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图;将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型,并根据所述目标预设场景模型匹配相应的通话参数。第二方面,本申请实施例了提供了的一种语音信息的处理装置,包括:构建单元,用于构建预设场景模型,所述预设场景模型中包括预设数量的语谱图;训练单元,用于对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型;分析单元,用于采集当前环境中的目标语音信息,并对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图;输入单元,用于将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型,并根据所述目标预设场景模型匹配相应的通话参数。第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的语音信息的处理方法。第四方面,本申请实施例提供的电子设备,包括处理器和存储器,所述存储器有计算机程序,其中,所述处理器通过调用所述计算机程序,用于执行步骤:构建预设场景模型,所述预设场景模型中包括预设数量的语谱图;对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型;采集当前环境中的目标语音信息,并对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图;将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型,并根据所述目标预设场景模型匹配相应的通话参数。附图说明下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其它有益效果显而易见。图1是本申请实施例提供的语音信息的处理方法的流程示意图。图2为本申请实施例提供的语音信息的处理方法的另一流程示意图。图3是本申请实施例提供的语音信息的处理方法的场景示意图。图4为本申请实施例提供的语音信息的处理装置的模块示意图。图5为本申请实施例提供的语音信息的处理装置的另一模块示意图。图6为本申请实施例提供的电子设备的结构示意图。图7为本申请实施例提供的电子设备的另一结构示意图。具体实施方式请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。本文所使用的术语「模块」可看做为在该运算系统上执行的软件对象。本文该的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文该的装置及方法优选的以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。本申请实施例提供一种语音信息的处理方法,该语音信息的处理方法的执行主体可以是本申请实施例提供的语音信息的处理装置,或者集成了该语音信息的处理装置的电子设备,其中该语音信息的处理装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑(PDA,PersonalDigitalAssistant)等。以下进行具体分析说明。本专利技术实施例提供一种语音信息的处理方法,包括:构建预设场景模型,所述预设场景模型中包括预设数量的语谱图;对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型;采集当前环境中的目标语音信息,并对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图;将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型,并根据所述目标预设场景模型匹配相应的通话参数。在一种实施方式中,所述构建预设场景模型的步骤,可以包括:通过预设采样率采集预设数量的语音信息;将所述预设数量的语音信息转化为相应的语谱图,根据所述语谱图构建预设场景模型。在一种实施方式中,所述将所述预设数量的语音信息转化为相应的语谱图的步骤,可以包括:将所述语音信息进行分帧处理,以得到第一分帧数据;对所述第一分帧数据进行傅里叶变换,生成语音信息相应的语谱图。在一种实施方式中,所述对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型的步骤,可以包括:采用卷积神经网络对进行预设场景模型中的语谱图进行训练,以生成相应的场景识别模型。在一种实施方式中,所述对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图的步骤,可以包括:对所述目标语音信息进行分帧处理,以得到第二分帧数据;对所述第二分帧数据进行傅里叶变换,以得到所述目标语音信息相应的目标语谱图。在一种实施方式中,所述将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型的步骤,可以包括:将所述目标语谱图输入场景识别模型;通过场景识别模型对所述目标语谱图进行特征遍历,以确定该目标语谱图相应的目标预设场景模型。在一种实施方式中,所述根据所述目标预设场景模型匹配相应的通话参数的步骤之后,还可以包括:生成相应的提示信息,以提示用户以匹配到的通话参数进行通话调节;当接收到所述提示信息相应的确认指令时,根据匹配到通话参数进行通话调节。本申请实施例提供一种语音信息的处理方法,如图1所示,图1为本申请实施例提供的语音信息的处理方法的流程示意图,该语音信息的处理方法可以包括以下步骤:在步骤S101中,构建预设场景模型。需要说明的是,该预设场景模型为用户通话可能处于的场景,如马路场景、地铁场景、大风场景、下雨场景或者人声嘈杂场景,针对不同的场景模型,可以关联设置不同的通话参数,如针对不同场景下对通话语音不同的降噪处理、平衡器处理、声音平滑度处理等等,使得在相应的场景下,采取较佳的通话参数,实现在相应的场景下的较佳通话效果。其中,电子设备可以采集在特定场景下的预设数量的语音信息本文档来自技高网...

【技术保护点】
一种语音信息的处理方法,其中,包括:/n构建预设场景模型,所述预设场景模型中包括预设数量的语谱图;/n对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型;/n采集当前环境中的目标语音信息,并对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图;/n将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型,并根据所述目标预设场景模型匹配相应的通话参数。/n

【技术特征摘要】
【国外来华专利技术】一种语音信息的处理方法,其中,包括:
构建预设场景模型,所述预设场景模型中包括预设数量的语谱图;
对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型;
采集当前环境中的目标语音信息,并对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图;
将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型,并根据所述目标预设场景模型匹配相应的通话参数。


如权利要求1所述的语音信息的处理方法,其中,所述构建预设场景模型的步骤,包括:
通过预设采样率采集预设数量的语音信息;
将所述预设数量的语音信息转化为相应的语谱图,根据所述语谱图构建预设场景模型。


如权利要求2所述的语音信息的处理方法,其中,所述将所述预设数量的语音信息转化为相应的语谱图的步骤,包括:
将所述语音信息进行分帧处理,以得到第一分帧数据;
对所述第一分帧数据进行傅里叶变换,生成语音信息相应的语谱图。


如权利要求1所述的语音信息的处理方法,其中,所述对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型的步骤,包括:
采用卷积神经网络对进行预设场景模型中的语谱图进行训练,以生成相应的场景识别模型。


如权利要求1至4任一项所述的语音信息的处理方法,其中,所述对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图的步骤,包括:
对所述目标语音信息进行分帧处理,以得到第二分帧数据;
对所述第二分帧数据进行傅里叶变换,以得到所述目标语音信息相应的目标语谱图。


如权利要求5所述的语音信息的处理方法,其中,所述将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型的步骤,包括:
将所述目标语谱图输入场景识别模型;
通过场景识别模型对所述目标语谱图进行特征遍历,以确定该目标语谱图相应的目标预设场景模型。


如权利要求1所述的语音信息的处理方法,其中,所述根据所述目标预设场景模型匹配相应的通话参数的步骤之后,还包括:
生成相应的提示信息,以提示用户以匹配到的通话参数进行通话调节;
当接收到所述提示信息相应的确认指令时,根据匹配到通话参数进行通话调节。


一种语音信息的处理装置,其中,包括:
构建单元,用于构建预设场景模型,所述预设场景模型中包括预设数量的语谱图;
训练单元,用于对所述预设场景模型中的语谱图进行训练,以生成相应的场景识别模型;
分析单元,用于采集当前环境中的目标语音信息,并对所述目标语音信息进行分析,以得到所述目标语音信息相应的目标语谱图;
输入单元,用于将所述目标语谱图输入场景识别模型,以确定相应的目标预设场景模型,并根据所述目标预设场景模型匹配相应的通话参数。


如权利要求8所述的语音信息的处理装置,其中,所述构建单元,包括:
采集子单元,用于通过预设采样率采集预设数量的语音信息;
转化子单元,用于将所述预设数量的语音信息转化为相应的语谱图,根据所述语谱图构建预设场景模型。


如权利...

【专利技术属性】
技术研发人员:陈岩
申请(专利权)人:深圳市欢太科技有限公司OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利