一种语音合成测试方法、系统、电子设备和存储介质技术方案

技术编号：36187686 阅读：21 留言：0更新日期：2022-12-31 20:55

本公开提供了一种语音合成测试方法、系统、电子设备和存储介质，涉及人工智能技术领域，尤其涉及语音合成技术领域。具体实现方案为：设置应用环境上下文，其中，该应用环境上下文中包含语音合成包的初始包名；接收外部指令，该外部指令中包含至少一个包名修改指令；以及，根据该至少一个包名修改指令，对该应用环境上下文进行修改，并利用修改后的应用环境上下文对该语音合成包进行鉴权，以得到测试数据。本公开能够提高测试效果，并减少对存储空间的浪费。间的浪费。间的浪费。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音合成测试方法、系统、电子设备和存储介质

[0001]本公开涉及人工智能
，尤其涉及语音合成

技术介绍

[0002]随着人工智能(Artificial Intelligence，AI)技术快速发展，越来越多的智能终端产品都会搭载语音交互技术，语音交互技术改变了人机交互形式。语音合成(Text To Speech，TTS)是人机对话中重要的组成部分，能让机器自然流畅说话是提高交互体验关键所在。为了从端到端角度保障合成音频数据完整性且音频音质无异常，需要对语音合成产品(如集成了SDK和语音合成模型的应用程序包)进行测试，以保障应用程序包提供的软件开发工具包(Software Development Kit，SDK)以及合成模型的质量。

技术实现思路

[0003]本公开提供了一种语音合成测试方法、系统、电子设备和存储介质。
[0004]根据本公开的一方面，提供了一种语音合成测试方法，包括：
[0005]设置应用环境上下文，其中，该应用环境上下文中包含语音合成包的初始包名；
[0006]接收外部指令，该外部指令中包含至少一个包名修改指令；以及，
[0007]根据该至少一个包名修改指令，对该应用环境上下文进行修改，并利用修改后的应用环境上下文对语音合成业务包进行鉴权，以得到测试数据。
[0008]根据本公开的另一方面，提供了一种语音合成测试系统，包括测试设备，该测试设备包括：
[0009]业务层模块，用于设置应用环境上下文，其中，该应用环境上...

【技术保护点】

【技术特征摘要】
1.一种语音合成测试方法，包括：设置应用环境上下文，其中，所述应用环境上下文中包含语音合成包的初始包名；接收外部指令，所述外部指令中包含至少一个包名修改指令；以及，根据所述至少一个包名修改指令，对所述应用环境上下文进行修改，并利用修改后的应用环境上下文对所述语音合成包进行鉴权，以得到测试数据。2.根据权利要求1所述的方法，还包括，设置所述语音合成包的应用标识和所述语音合成包的许可信息；所述根据所述至少一个包名修改指令，对所述应用环境上下文进行修改，并利用修改后的应用环境上下文对所述语音合成包进行鉴权，包括：根据所述至少一个包名修改指令，将应用环境上下文中的所述包含语音合成包的初始包名修改为所述包名修改指令所指示的包名；对所述应用环境上下文中的所述语音合成包的应用标识、所述语音合成包的许可信息及修改后的包名进行匹配验证；在所述匹配验证通过的情况下，对所述语音合成包的鉴权成功；或者，在所述匹配验证不通过的情况下，对所述语音合成包的鉴权失败。3.根据权利要求2所述的方法，其中，所述匹配验证通过的情况包括：所述语音合成包的许可信息中包含的应用标识与所述语音合成包的应用标识匹配，并且，所述语音合成包的许可信息中包含的包名与所述修改后的包名匹配。4.根据权利要求2所述的方法，其中，所述匹配验证不通过的情况包括：所述语音合成包的许可信息中包含的应用标识与所述语音合成包的应用标识不匹配；和/或，所述语音合成包的许可信息中包含的包名与所述修改后的包名不匹配。5.根据权利要求1
‑
4中任一所述的方法，还包括：接收音频文件及所述音频文件的预期长度，所述音频文件由所述语音合成包进行语音合成得到，所述音频文件的预期长度由所述语音合成包确定；确定所述音频文件的实际长度；根据所述音频文件的预期长度和所述音频文件的实际长度，对语音合成效果进行测试，以得到测试数据。6.根据权利要求5所述的方法，其中，所述根据所述音频文件的预期长度和所述音频文件的实际长度，对语音合成效果进行测试，包括：在所述音频文件的预期长度与所述音频文件的实际长度匹配的情况下，确定语音合成的效果符合要求；和/或，在所述音频文件的预期长度与所述音频文件的实际长度不匹配的情况下，确定语音合成的效果不符合要求。7.根据权利要求5或6所述的方法，其中，所述接收音频文件，包括：接收被压缩的音频文件；所述确定所述音频文件的实际长度，包括：对所述被压缩的音频文件进行解压缩，得到解压缩后的音频文件；确定所述解压缩后的音频文件的实际长度。8.根据权利要求1
‑
7中任一所述的方法，所述设置应用环境上下文之前，还包括：接收测试场景；
其中，所述测试场景由中控设备对收到的场景测试触发指令进行解析得到，所述场景测试触发指令由远程平台发送。9.根据权利要求8所述的方法，还包括：将所述测试数据发送至所述中控设备，以供所述中控设备对测试数据进行处理和/或校验、并将处理和/或校验后的测试数据上传至所述远程平台。10.一种语音合成测试系统，包括测试设备，所述测试设备包括：业务层模块，用于设置应用环境上下文，其中，所述应用环境上下文中包含语音合成包的初始包名；软件开发工具包SDK层模块，用于接收外部指令，所述外部指令中包含至少一个包名修改指令；根据所述至少一个包名修改指令，对所述应用环境上下文进行修改，并利用修改后的应用环境上下文对所述语音合成包进行鉴...

【专利技术属性】
技术研发人员：郑洪，刘巍，车婷婷，黄明明，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人