网页端音频生成方法、装置、存储介质制造方法及图纸

技术编号:25040538 阅读:16 留言:0更新日期:2020-07-29 05:31
本发明专利技术涉及音频处理技术领域,公开了一种网页端音频生成方法,用于将网页端的文本转换为能够在网页端播放的音频,包括:接收文本信息,并将文本信息发送至文本转语音服务器;接收文本转语音服务器分段返回的与文本信息对应的若干个分段音频流;构建音频输出流;以及在音频输出流中输入波形音频文件格式wav头信息,并依次输入若干个分段音频流。本发明专利技术在接收到网页端的文本信息后,新建音频输出流,在音频输出流中输入wav头信息,并依次输入采用语音转文本服务器所转换的分段音频流,如此,可以直接在网页端将音频流作为wav格式的音频进行播放,使得网页端用户能够收听高质量的音频,并减少音频生成的等待时间,此外,还避免了在网页端部署PCM播放器。

【技术实现步骤摘要】
网页端音频生成方法、装置、存储介质
本专利技术涉及音频处理
,具体地涉及一种网页端音频生成方法、装置、存储介质。
技术介绍
TTS(TextToSpeech,从文本到语音)技术被广泛用于在线语音生成和播放,从短语生成到文章阅读具有较为广泛的应用需求。例如:将网页端文本转换为音频进行播放。TTS在短语生成方面的技术应用已经较为成熟,但是对于长文章的处理,TTS处理完成后还需要将所生成的音频传输至网页端,不仅需要完成长文章从文本到音频的转换,还需要考虑网页端用户在线等待音频生成的时间问题。目前支持网页端直接播放的音频格式包括wav(WaveformAudioFileFormat,波形音频文件格式,是微软与IBM公司所开发的在个人电脑存储音频流的编码格式)和mp3(MovingPictureExpertsGroupAudioLayerIII,简称mp3音频)。但是若将完整的长文章从文本转换成网页端支持播放的音频格式,并传输至网页端,则无论是采用wav格式还是mp3格式的音频格式,均会给网页端用户带来较长等待时间,从而影响用户体验。
技术实现思路
为了解决或至少部分解决上述技术问题,本专利技术实施例提供了一种网页端音频生成方法及生成装置。根据本专利技术实施例的第一方面,提供一种网页端音频生成方法,用于将网页端的文本转换为能够在网页端播放的音频,所述方法包括:接收文本信息,并将所述文本信息发送至文本转语音服务器;接收所述文本转语音服务器分段返回的与所述文本信息对应的若干个分段音频流;构建音频输出流;以及在所述音频输出流中输入波形音频文件格式wav头信息,并依次输入若干个所述分段音频流。优选的,所述接收文本信息和所述将所述文本信息发送至文本转语音服务器均采用超文本传输协议HTTP进行传输。优选的,所述在所述音频输出流中输入波形音频文件格式wav头信息,包括:监测是否为第一次接收到所述分段音频流;以及在第一次接收到所述分段音频流时,在所述音频输出流中输入波形音频文件格式wav头信息。优选的,所述监测是否为第一次接收到所述分段音频流,包括:监测所述音频输出流的当前状态是否为空;以及在所述音频输出流的当前状态为空时,确认为第一次接收到所述分段音频流。优选的,所述分段音频流为脉冲编码调制PCM格式的音频流。根据本专利技术实施例的第二方面,还提供一种网页端音频生成装置,所述网页端音频生成装置包括:文本传输模块,用于接收文本信息,并将所述文本信息发送至文本转语音服务器;接收模块,用于接收所述文本转语音服务器分段返回的与所述文本信息对应的若干个分段音频流;构建模块,用于构建音频输出流;以及音频传输模块,用于在所述音频输出流中输入波形音频文件格式wav头信息,并依次输入若干个所述分段音频流。优选的,所述文本传输模块包括:文本接收子模块,用于采用超文本传输协议HTTP接收文本信息;以及文本发送子模块,用于采用超文本传输协议HTTP将所述文本信息发送至文本转语音服务器。优选的,所述音频传输模块包括:监测子模块,用于监测是否为第一次接收到所述分段音频流;以及传输子模块,用于在第一次接收到所述分段音频流时,在所述音频输出流中输入波形音频文件格式wav头信息。根据本专利技术实施例的第三方面,本专利技术实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有指令,所述指令用于使得所述机器可读存储介质能够执行上述网页端音频生成方法。根据本专利技术实施例的第四方面,本专利技术实施例还提供一种设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行权利要求1-5中任一项所述的网页端音频生成方法。通过上述技术方案,在接收到网页端的文本信息后,新建音频输出流,在音频输出流中输入wav头信息,并依次输入采用语音转文本服务器所转换的分段音频流,如此,可以直接在网页端将音频流作为wav格式的音频进行播放,使得网页端用户能够收听高质量的音频,并减少音频生成的等待时间,此外,还避免了在网页端部署PCM播放器。本专利技术实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术实施例,但并不构成对本专利技术实施例的限制。在图中:图1示出了本专利技术实施例提供的网页端音频生成方法的流程图;图2示出了本专利技术实施例提供的网页端音频生成方法的具体应用示例的流程示意图;图3示出了本专利技术实施例提供的网页端音频生成装置的组成结构示意图;图4示出了本专利技术实施例提供的文本传输模块的组成结构示意图;图5示出了本专利技术实施例提供的音频传输模块的组成结构示意图。附图标记说明301、文本传输模块302、接收模块303、构建模块304、音频传输模块3011、文本接收子模块3012、文本发送子模块3041、监测子模块3042、传输子模块具体实施方式下面将参考若干示例性实施方式来描述本专利技术的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。相反,提供这些实施方式是为使本专利技术更加透彻和完整,并能够将本专利技术的范围完整地传达给本领域的技术人员。下面结合附图和具体实施例对本专利技术的技术方案进一步详细阐述。图1示出了本专利技术实施例提供的网页端音频生成方法的流程图。参考图1,本专利技术实施例提供的网页端音频生成方法,用于将网页端的文本转换为能够在网页端播放的音频,可以包括如下步骤:S100、接收文本信息,并将文本信息发送至文本转语音服务器。具体来讲,网页端后端服务器接收网页端发送的文本信息,并将所接收的文本信息发送至TTS(TextToSpeech,文本转语音)服务器。在本专利技术实施例中,接收文本信息和将所述文本信息发送至文本转语音服务器均采用超文本传输协议HTTP进行传输。HTTP是指超文本传输协议,是一种无状态协议。客户端发送一次请求,服务器端接收请求,经过处理返回给客户端信息,然后客户端和服务器端的链接断开。例如:网页客户端以HTTP协议将文本信息发送至网页后端服务器的时候,就会等待网页后端服务器对该文本信息的响应。而网页后端服务器将该该文本信息发送至TTS服务器,也将等待TTS服务器对该文本做出的响应。S200、接收文本转语音服务器分段返回的与文本信息对应的若干个分段音频流。网页后端服务器,将文本信息发送至TTS服务器后,TTS服务器将文本信息转换为音频。如果将整段文本信息全部转换为音频后再传输至网页后端服务器,进而发送至网页端进行播放,将会给网页端用户带来较长的等待时间。因此,TTS服务器在接收到文本信息后,每完成一段设定长度的文本信息的转换就将其返回至网页后端服务器。本文档来自技高网...

【技术保护点】
1.一种网页端音频生成方法,其特征在于,用于将网页端的文本转换为能够在网页端播放的音频,所述方法包括:/n接收文本信息,并将所述文本信息发送至文本转语音服务器;/n接收所述文本转语音服务器分段返回的与所述文本信息对应的若干个分段音频流;/n构建音频输出流;以及/n在所述音频输出流中输入波形音频文件格式wav头信息,并依次输入若干个所述分段音频流。/n

【技术特征摘要】
1.一种网页端音频生成方法,其特征在于,用于将网页端的文本转换为能够在网页端播放的音频,所述方法包括:
接收文本信息,并将所述文本信息发送至文本转语音服务器;
接收所述文本转语音服务器分段返回的与所述文本信息对应的若干个分段音频流;
构建音频输出流;以及
在所述音频输出流中输入波形音频文件格式wav头信息,并依次输入若干个所述分段音频流。


2.根据权利要求1所述的网页端音频生成方法,其特征在于,所述接收文本信息和所述将所述文本信息发送至文本转语音服务器均采用超文本传输协议HTTP进行传输。


3.根据权利要求1所述的网页端音频生成方法,其特征在于,所述在所述音频输出流中输入波形音频文件格式wav头信息,包括:
监测是否为第一次接收到所述分段音频流;以及
在第一次接收到所述分段音频流时,在所述音频输出流中输入波形音频文件格式wav头信息。


4.根据权利要求3所述的网页端音频生成方法,其特征在于,所述监测是否为第一次接收到所述分段音频流,包括:
监测所述音频输出流的当前状态是否为空;以及
在所述音频输出流的当前状态为空时,确认为第一次接收到所述分段音频流。


5.根据权利要求1所述的网页端音频生成方法,其特征在于,所述分段音频流为脉冲编码调制PCM格式的音频流。


6.一种网页端音频生成装置,其特征在于,所述网页端音频生成装置包括:
文本传输模块...

【专利技术属性】
技术研发人员:郁霖雷欣李志飞
申请(专利权)人:问问智能信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1