语音合成系统的优化方法和装置制造方法及图纸

技术编号:13175210 阅读:45 留言:0更新日期:2016-05-10 18:34
本发明专利技术公开了一种语音合成系统的优化方法和装置,其中,语音合成系统的优化方法包括:接收包含文本信息的语音合成请求;确定在接收到语音合成请求时语音合成系统的负载等级;以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成。本发明专利技术实施例的语音合成系统的优化方法和装置,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。

【技术实现步骤摘要】

本专利技术涉及语音合成
,尤其涉及一种语音合成系统的优化方法和装置
技术介绍
随着移动互联网和人工智能技术的快速发展,语音播报、听小说、听新闻、智能交互等一系列语音合成的场景越来越多。目前,语音合成系统在对文本进行语音合成时,首先对输入的文本进行归一化预处理,然后对文本进行分词、词性标注、注音等操作,再对文本进行韵律等级的预测,以及预测声学参数,最后输出最终的语音结果。但是,语音合成系统的配置一般都是固定的,无法根据实际场景及负载情况进行弹性的设置,无法适应不同环境下的语音合成需求。例如:当语音合成系统短时间内接收到大量的语音合成请求时,很有可能超出语音合成系统的负载能力,会造成语音合成请求的堆积,导致用户收到反馈结果延时,从而影响用户使用体验。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种语音合成系统的优化方法,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。本专利技术的第二个目的在于提出一种语音合成系统的优化装置。为了实现上述目的,本专利技术第一方面实施例提出了一种语音合成系统的优化方法,包括:接收包含文本信息的语音合成请求;确定在接收到所述语音合成请求时语音合成系统的负载等级;以及选择与所述负载等级对应的语音合成路径,并根据所述语音合成路径对所述文本信息进行语音合成。本专利技术实施例的语音合成系统的优化方法,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。本专利技术第二方面实施例提出了一种语音合成系统的优化装置,包括:接收模块,用于接收包含文本信息的语音合成请求;确定模块,用于确定在接收到所述语音合成请求时语音合成系统的负载等级;以及合成模块,用于选择与所述负载等级对应的语音合成路径,并根据所述语音合成路径对所述文本信息进行语音合成。本专利技术实施例的语音合成系统的优化装置,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。【附图说明】图1是根据本专利技术一个实施例的语音合成系统的优化方法的流程图;图2是根据本专利技术一个具体实施例的语音合成系统的优化方法的流程图;图3是根据本专利技术一个具体实施例的语音合成系统的框架结构示意图;图4是根据本专利技术一个实施例的语音合成系统的优化装置的结构示意图。【具体实施方式】下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的语音合成系统的优化方法和装置。图1是根据本专利技术一个实施例的语音合成系统的优化方法的流程图。如图1所示,语音合成系统的优化方法可包括:S1、接收包含文本信息的语音合成请求。其中,语音合成请求可包括多种场景,例如将好友发来的短信等文字信息转换成语音、将小说的文本信息转换成语音进行播放等等。在本专利技术的一个实施例中,可接收用户通过各种客户端如网页客户端、APP客户端发出的语音合成请求。S2、确定在接收到语音合成请求时语音合成系统的负载等级。具体地,在接收到语音合成请求时,可获取当前时刻语音合成系统接收到的语音合成请求数量以及这些语音合成请求对应的平均响应时间,然后根据语音合成请求数量和平均响应时间确定负载等级。当语音合成请求数量小于响应请求能力,且平均响应时间小于预设时间时,确定负载等级为第一等级;当语音合成请求数量小于响应请求能力,且平均响应时间大于预设时间时,确定负载等级为第二等级;当语音合成请求数量大于响应请求能力时,确定负载等级为第三等级。举例来说,语音合成系统的后台由服务器集群构成,假设服务器集群的响应请求能力为每秒响应500个请求,而此时语音合成系统在1秒钟内,接收到的语音合成请求数量为100个,并且这100个语音合成请求的平均响应时间小于预设时间500毫秒,则可确定当前语音合成系统并未超负载,且性能良好,负载等级为第一等级。假设语音合成系统在1秒钟内,接收到的语音合成请求数量为100个,但是这100个语音合成请求的平均响应时间大于预设时间500毫秒,则可确定当前语音合成系统虽然未超负载,但是性能已经开始降低,负载等级为第二等级。假设语音合成系统在1秒钟内,接收到的语音合成请求数量为1000个,则说明当前语音合成系统超负载,负载等级为第三等级。S3、选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成。当负载等级为第一等级时,可选择与第一等级对应的第一路径对文本信息进行语音合成。其中,第一路径可包括LSTM(长短时记忆,Long short-term memory)模型和波形拼接模型,波形拼接模型采用第一参数设置。当负载等级为第二等级时,可选择与第二等级对应的第二路径对文本信息进行语音合成。其中,第二路径可包括HTS(HMM_based Speech Synthesis System,隐马尔可夫语音合成系统)模型和波形拼接模型,波形拼接模型采用第二参数设置。当负载等级为第三等级时,可选择与第三等级对应的第三路径对文本信息进行语音合成。其中,第三路径包括HTS模型和声码器模型。在本专利技术的一个实施例中,语音合成系统在对文本信息进行语音合成时,首先可通过文本预处理模块对输入的文本进行归一化预处理,然后通过文本分析模块对文本进行分词、词性标注、注音等操作,再通过韵律层级预测模块对文本进行韵律等级的预测,以及通过声学模型模块预测声学参数,最后通过语音合成模块输出最终的语音结果。上述五个模块构成了实当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种语音合成系统的优化方法,其特征在于,包括以下步骤:接收包含文本信息的语音合成请求;确定在接收到所述语音合成请求时语音合成系统的负载等级;以及选择与所述负载等级对应的语音合成路径,并根据所述语音合成路径对所述文本信息进行语音合成。

【技术特征摘要】

【专利技术属性】
技术研发人员:郝庆畅李秀林白洁唐海员
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1