一种语音合成测试方法、系统、电子设备和存储介质技术方案

技术编号:36187686 阅读:21 留言:0更新日期:2022-12-31 20:55
本公开提供了一种语音合成测试方法、系统、电子设备和存储介质,涉及人工智能技术领域,尤其涉及语音合成技术领域。具体实现方案为:设置应用环境上下文,其中,该应用环境上下文中包含语音合成包的初始包名;接收外部指令,该外部指令中包含至少一个包名修改指令;以及,根据该至少一个包名修改指令,对该应用环境上下文进行修改,并利用修改后的应用环境上下文对该语音合成包进行鉴权,以得到测试数据。本公开能够提高测试效果,并减少对存储空间的浪费。间的浪费。间的浪费。

【技术实现步骤摘要】
一种语音合成测试方法、系统、电子设备和存储介质


[0001]本公开涉及人工智能
,尤其涉及语音合成


技术介绍

[0002]随着人工智能(Artificial Intelligence,AI)技术快速发展,越来越多的智能终端产品都会搭载语音交互技术,语音交互技术改变了人机交互形式。语音合成(Text To Speech,TTS)是人机对话中重要的组成部分,能让机器自然流畅说话是提高交互体验关键所在。为了从端到端角度保障合成音频数据完整性且音频音质无异常,需要对语音合成产品(如集成了SDK和语音合成模型的应用程序包)进行测试,以保障应用程序包提供的软件开发工具包(Software Development Kit,SDK)以及合成模型的质量。

技术实现思路

[0003]本公开提供了一种语音合成测试方法、系统、电子设备和存储介质。
[0004]根据本公开的一方面,提供了一种语音合成测试方法,包括:
[0005]设置应用环境上下文,其中,该应用环境上下文中包含语音合成包的初始包名;
[0006]接收外部指令,该外部指令中包含至少一个包名修改指令;以及,
[0007]根据该至少一个包名修改指令,对该应用环境上下文进行修改,并利用修改后的应用环境上下文对语音合成业务包进行鉴权,以得到测试数据。
[0008]根据本公开的另一方面,提供了一种语音合成测试系统,包括测试设备,该测试设备包括:
[0009]业务层模块,用于设置应用环境上下文,其中,该应用环境上下文中包含语音合成包的初始包名;
[0010]SDK层模块,用于接收外部指令,该外部指令中包含至少一个包名修改指令;根据该至少一个包名修改指令,对该应用环境上下文进行修改,并利用修改后的应用环境上下文对语音合成业务包进行鉴权,以得到测试数据。
[0011]根据本公开的另一方面,提供了一种电子设备,包括:
[0012]至少一个处理器;以及
[0013]与该至少一个处理器通信连接的存储器;其中,
[0014]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开中任一实施例的方法。
[0015]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开中任一实施例的方法。
[0016]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开中任一实施例的方法。
[0017]本公开实施例通过利用外部指令批量修改语音合成业务应用程序包的包名,以获得不同的包名,避免了测试过程中对语音合成业务的应用程序包进行重复打包和存储,能
够避免人工操作对测试质量的不利影响,从而提高测试效果,并且能够减少对存储空间的浪费,降低冗余率。
[0018]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0020]图1是本公开的一个应用场景示意图;
[0021]图2是本公开一实施例的语音合成测试方法200的示意图;
[0022]图3是根据本公开一实施例的测试设备的结构示意图;
[0023]图4是根据本公开一实施例中音频完整性测试方案流程图;
[0024]图5是根据本公开一实施例的语音合成模型自动化测试方案示意图;
[0025]图6是根据本公开一实施例的测试设备600的结构示意图;
[0026]图7是根据本公开一实施例的一种语音合成测试系统700的结构示意图;
[0027]图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。
具体实施方式
[0028]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0029]语音合成(Text To Speech,TTS)是将文本转化成语音的技术,能够打通人机交互闭环。可以支撑多场景、多语言的音色,支持自定义音量、语速等参数。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。为了从端到端角度保障合成音频数据完整性且音频音质无异常,在相关技术中,由测试人员对语音合成包进行验证,以保障其提供的SDK及合成模型的质量。
[0030]现有的测试方法中,根据不同的业务需求,需要验证不同包名的鉴权及语音接口功能;为了验证不同包名的鉴权及语音接口功能,需要人工对语音合成包重复打包,其打包后的测试工程代码需要备份多套,因此对存储空间浪费,并且容易发生人工的误操作。
[0031]本公开实施例提出一种语音合成测试方法,图1是本公开的一个应用场景示意图。如图1所示,业务方(或用户)110向语音合成生产设备120提出业务要求,由语音合成生产设备120生成语音合成包,该语音合成包集成TTS SDK(简称SDK)、还可以集成语音合成模型(语音合成模型用于实现离线语音合成)、以及业务方的模拟业务逻辑。如果应用于安卓(Android)系统,该语音合成包可以为安卓应用程序包(APK,Android application package)。在将语音合成包提供给业务方(或用户)110之前,语音合成生产设备120可以将语音合成包发送至语音合成测试系统130,该语音合成测试系统130可以采用本公开实施例提出的语音合成测试方法、对语音合成包进行测试,该测试可以包括鉴权、还可以包括测试音频合成的完整性等。在测试通过之后,语音合成生产设备120或者语音合成测试系统130可以将语音合成包提供给业务方(或用户)110,从业务方(或用户)110使用。
[0032]图2是本公开一实施例的语音合成测试方法200的示意图,包括:
[0033]S210、设置应用环境上下文(context),其中,该应用环境上下文中包含语音合成包的初始包名;
[0034]S220、接收外部指令,该外部指令中包含至少一个包名修改指令;以及,
[0035]S230、根据该至少一个包名修改指令,对该应用环境上下文进行修改,并利用修改后的应用环境上下文对语音合成包进行鉴权,以得到测试数据。
[0036]在一些示例中,该外部指令可以是广播指令。本公开实施例提出的语音合成测试方法可以应用于语音测试系统中,该语音测试系统可以包括测试设备,还可以包括远程平台和中控设备。以该测试设备为安卓测试设备为例,上述广播指令可以通过安卓调试桥(ADB,Android Debug Brid本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音合成测试方法,包括:设置应用环境上下文,其中,所述应用环境上下文中包含语音合成包的初始包名;接收外部指令,所述外部指令中包含至少一个包名修改指令;以及,根据所述至少一个包名修改指令,对所述应用环境上下文进行修改,并利用修改后的应用环境上下文对所述语音合成包进行鉴权,以得到测试数据。2.根据权利要求1所述的方法,还包括,设置所述语音合成包的应用标识和所述语音合成包的许可信息;所述根据所述至少一个包名修改指令,对所述应用环境上下文进行修改,并利用修改后的应用环境上下文对所述语音合成包进行鉴权,包括:根据所述至少一个包名修改指令,将应用环境上下文中的所述包含语音合成包的初始包名修改为所述包名修改指令所指示的包名;对所述应用环境上下文中的所述语音合成包的应用标识、所述语音合成包的许可信息及修改后的包名进行匹配验证;在所述匹配验证通过的情况下,对所述语音合成包的鉴权成功;或者,在所述匹配验证不通过的情况下,对所述语音合成包的鉴权失败。3.根据权利要求2所述的方法,其中,所述匹配验证通过的情况包括:所述语音合成包的许可信息中包含的应用标识与所述语音合成包的应用标识匹配,并且,所述语音合成包的许可信息中包含的包名与所述修改后的包名匹配。4.根据权利要求2所述的方法,其中,所述匹配验证不通过的情况包括:所述语音合成包的许可信息中包含的应用标识与所述语音合成包的应用标识不匹配;和/或,所述语音合成包的许可信息中包含的包名与所述修改后的包名不匹配。5.根据权利要求1

4中任一所述的方法,还包括:接收音频文件及所述音频文件的预期长度,所述音频文件由所述语音合成包进行语音合成得到,所述音频文件的预期长度由所述语音合成包确定;确定所述音频文件的实际长度;根据所述音频文件的预期长度和所述音频文件的实际长度,对语音合成效果进行测试,以得到测试数据。6.根据权利要求5所述的方法,其中,所述根据所述音频文件的预期长度和所述音频文件的实际长度,对语音合成效果进行测试,包括:在所述音频文件的预期长度与所述音频文件的实际长度匹配的情况下,确定语音合成的效果符合要求;和/或,在所述音频文件的预期长度与所述音频文件的实际长度不匹配的情况下,确定语音合成的效果不符合要求。7.根据权利要求5或6所述的方法,其中,所述接收音频文件,包括:接收被压缩的音频文件;所述确定所述音频文件的实际长度,包括:对所述被压缩的音频文件进行解压缩,得到解压缩后的音频文件;确定所述解压缩后的音频文件的实际长度。8.根据权利要求1

7中任一所述的方法,所述设置应用环境上下文之前,还包括:接收测试场景;
其中,所述测试场景由中控设备对收到的场景测试触发指令进行解析得到,所述场景测试触发指令由远程平台发送。9.根据权利要求8所述的方法,还包括:将所述测试数据发送至所述中控设备,以供所述中控设备对测试数据进行处理和/或校验、并将处理和/或校验后的测试数据上传至所述远程平台。10.一种语音合成测试系统,包括测试设备,所述测试设备包括:业务层模块,用于设置应用环境上下文,其中,所述应用环境上下文中包含语音合成包的初始包名;软件开发工具包SDK层模块,用于接收外部指令,所述外部指令中包含至少一个包名修改指令;根据所述至少一个包名修改指令,对所述应用环境上下文进行修改,并利用修改后的应用环境上下文对所述语音合成包进行鉴...

【专利技术属性】
技术研发人员:郑洪刘巍车婷婷黄明明
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1