语音处理方法、装置及终端制造方法及图纸

技术编号:20122416 阅读:21 留言:0更新日期:2019-01-16 12:52
本发明专利技术提出了一种语音处理方法、装置及终端,该语音处理方法包括:获取待输出语音的文字内容;根据文字内容以及预先存储的语音表达特征信息和待输出语音的预设发声者的声音特征信息,生成待输出语音;输出待输出语音。本发明专利技术的语音处理方法、装置及终端,可实现语音交互系统语音提示输出的定制,提升用户体验。

Speech Processing Method, Device and Terminal

The invention provides a speech processing method, device and terminal. The speech processing method includes: acquiring the text content of the speech to be output; generating the speech to be output according to the text content and the pre-stored speech expression characteristic information and the preset speaker's voice characteristic information of the speech to be output; and outputting the speech to be output. The voice processing method, device and terminal of the invention can realize customization of voice prompt output of voice interactive system and enhance user experience.

【技术实现步骤摘要】
语音处理方法、装置及终端
本专利技术涉及语音
,尤其涉及一种语音处理方法、装置及终端。
技术介绍
随着语音识别技术的不断普及,现在很多电子设备都配备有语音助手等智能语音交互系统。相关技术中,语音交互系统的语音提示输出通常只能为预设的几种声音,不能根据用户的喜好进行定制,用户体验差。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种语音处理方法,根据待输出语音的文字内容以及预先存储的语音表达特征信息和待输出语音的预设发声者的声音特征信息,生成并输出待输出语音,可实现语音交互系统语音提示输出的定制,提升用户体验。本专利技术的第二个目的在于提出一种语音处理装置。本专利技术的第三个目的在于提出一种终端。本专利技术的第四个目的在于提出一种电子设备。本专利技术的第五个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本专利技术第一方面实施例提出了一种语音处理方法,包括:获取待输出语音的文字内容;根据所述文字内容以及预先存储的语音表达特征信息和所述待输出语音的预设发声者的声音特征信息,生成所述待输出语音;输出所述待输出语音。根据本专利技术实施例提出的语音处理方法,首先,获取待输出语音的文字内容,然后,根据文字内容以及预先存储的语音表达特征信息和待输出语音的预设发声者的声音特征信息,生成待输出语音,最后,输出待输出语音,可实现语音交互系统语音提示输出的定制,提升用户体验。根据本专利技术的一个实施例,该语音处理方法还包括:获取所述预设发声者的原声语音;对所述原声语音进行特征提取,得到所述预设发声者的所述声音特征信息。根据本专利技术的一个实施例,该语音处理方法还包括:获取语音样本;基于深度学习算法对所述语音样本进行学习,得到所述语音表达特征信息。根据本专利技术的一个实施例,该语音处理方法还包括:获取用户输入的交互语音;根据所述交互语音获取对应的所述待输出语音的所述文字内容。根据本专利技术的一个实施例,所述语音表达特征信息包括以下信息中的任意一种或多种的组合:语调、停顿、语速和语气;和/或,所述声音特征信息包括以下信息中的任意一种或多种的组合:音色和音调。为达上述目的,本专利技术第二方面实施例提出了一种语音处理装置,包括:获取模块,用于获取待输出语音的文字内容;生成模块,用于根据所述文字内容以及预先存储的语音表达特征信息和所述待输出语音的预设发声者的声音特征信息,生成所述待输出语音;输出模块,用于输出所述待输出语音。根据本专利技术实施例提出的语音处理装置,首先,获取待输出语音的文字内容,然后,根据文字内容以及预先存储的语音表达特征信息和待输出语音的预设发声者的声音特征信息,生成待输出语音,最后,输出待输出语音,可实现语音交互系统语音提示输出的定制,提升用户体验。根据本专利技术的一个实施例,所述生成模块还用于:获取所述预设发声者的原声语音;对所述原声语音进行特征提取,得到所述预设发声者的所述声音特征信息;和/或,获取语音样本;基于深度学习算法对所述语音样本进行学习,得到所述语音表达特征信息。为达上述目的,本专利技术第三方面实施例提出了一种终端,包括:如本专利技术第二方面实施例所述的语音处理装置。为达上述目的,本专利技术第四方面实施例提出了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本专利技术第一方面实施例所述的语音处理方法。为达上述目的,本专利技术第五方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如本专利技术第一方面实施例所述的语音处理方法。附图说明图1是根据本专利技术一个实施例的语音处理方法的流程图;图2是根据本专利技术另一个实施例的语音处理方法的流程图;图3是根据本专利技术另一个实施例的语音处理方法的流程图;图4是根据本专利技术另一个实施例的语音处理方法的流程图;图5是根据本专利技术一个实施例的语音处理装置的结构图;图6是根据本专利技术一个实施例的终端的结构图;图7是根据本专利技术一个实施例的电子设备的结构图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面结合附图来描述本专利技术实施例的语音处理方法、装置及终端。图1是根据本专利技术一个实施例的语音处理方法的流程图,如图1所示,该语音处理方法包括:S101,获取待输出语音的文字内容。本专利技术实施例中,待输出语音即用户期望的语音交互系统(例如终端中的语音助手等)输出的语音。例如待输出语音为用户期望语音交互系统输出某个明星的声音,且该明星说的文字是“你可以听听音乐”,则语音交互系统获取待输出语音的文字内容“你可以听听音乐”。S102,根据文字内容以及预先存储的语音表达特征信息和待输出语音的预设发声者的声音特征信息,生成待输出语音。本专利技术实施例中,待输出语音的预设发声者即用户期望语音交互系统输出谁的声音,例如上述例子中的某个明星即为待输出语音的预设发声者。可预先存储语音表达特征信息和待输出语音的预设发声者的声音特征信息,在S101步骤获取到待输出语音的文字内容后,根据文字内容、预先存储语音表达特征信息和待输出语音的预设发声者的声音特征信息生成待输出语音。作为一种可行的实施方式,语音表达特征信息具体可包括但不限于以下信息中的任意一种或多种的组合:语调、停顿、语速和语气等;声音特征信息具体可包括但不限于以下信息中的任意一种或多种的组合:音色和音调等。其中,语调即句调,是指在句子中用来表达思想感情的抑扬顿挫的语音旋律;音调即声音频率的高低。S103,输出待输出语音。本专利技术实施例中,在S102步骤生成待输出语音后,输出待输出语音。例如当本方法应用于终端时,可通过终端的扬声器或者耳机输出待输出语音。根据本专利技术实施例提出的语音处理方法,首先,获取待输出语音的文字内容,然后,根据文字内容以及预先存储的语音表达特征信息和待输出语音的预设发声者的声音特征信息,生成待输出语音,最后,输出待输出语音,可实现语音交互系统语音提示输出的定制,提升用户体验。进一步的,如图2所示,图2是根据本专利技术另一个实施例的语音处理方法的流程图,图1所示实施例S102步骤中“待输出语音的预设发声者的声音特征信息”获取方法可包括:S201,获取预设发声者的原声语音。本专利技术实施例中,预设发声者的原声语音即预设发声者真实的语音。可通过麦克风等语音采集装置获取预设发声者的原声语音。S202,对原声语音进行特征提取,得到预设发声者的声音特征信息。本专利技术实施例中,可通过特征提取算法对S201步骤获取的原生语音进行特征提取,得到预设发声者的声音特征信息。作为一种可行的实施方式,声音特征信息具体可包括但不限于以下信息中的任意一种或多种的组合:音色和音调等。根据本专利技术实施例提出的语音处理方法,首先,获取预设发声者的原声语音,然后,对原声语音进行特征提取,得到预设发声者的声音特征信息。可有效、准确的获取预设发声者的声音特征信息。进一步的,如图3所示,图3是根据本专利技术另一个实施例的语音处理方法的流程图,图1所示实施例S102步骤中“语音表达特征信息”获取方法可包括本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:获取待输出语音的文字内容;根据所述文字内容以及预先存储的语音表达特征信息和所述待输出语音的预设发声者的声音特征信息,生成所述待输出语音;输出所述待输出语音。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:获取待输出语音的文字内容;根据所述文字内容以及预先存储的语音表达特征信息和所述待输出语音的预设发声者的声音特征信息,生成所述待输出语音;输出所述待输出语音。2.根据权利要求1所述的语音处理方法,其特征在于,还包括:获取所述预设发声者的原声语音;对所述原声语音进行特征提取,得到所述预设发声者的所述声音特征信息。3.根据权利要求1所述的语音处理方法,其特征在于,还包括:获取语音样本;基于深度学习算法对所述语音样本进行学习,得到所述语音表达特征信息。4.根据权利要求1所述的语音处理方法,其特征在于,还包括:获取用户输入的交互语音;根据所述交互语音获取对应的所述待输出语音的所述文字内容。5.根据权利要求1所述的语音处理方法,其特征在于,所述语音表达特征信息包括以下信息中的任意一种或多种的组合:语调、停顿、语速和语气;和/或,所述声音特征信息包括以下信息中的任意一种或多种的组合:音色和音调。6.一种语音处理装置,其...

【专利技术属性】
技术研发人员:杨鑫
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1