The invention discloses a test method based on batch speech recognition and TTS text synthesis. By establishing a software environment in the intelligent terminal to be tested and running the test APP automatically, ASR function test and TTS function test on the intelligent terminal to be tested are completed, and ASR reverse speech recognition function test is carried out after TTS function test, finally a clear and reliable comparison result is formed for later improvement and testing. It is helpful to improve the intelligent voice system in the intelligent terminal to be tested. The testing method integrates the whole process of speech recognition and text synthesis from sending test data to result statistics, covers multi-scene testing of speech recognition and TTS text synthesis, improves the speed and scope of speech recognition testing, ensures the applicability and reliability of speech recognition environment for later intelligent terminals, and the testing process is flexible. It can be used in all kinds of intelligent terminals at any time and anywhere. The intelligent voice control system is tested.
【技术实现步骤摘要】
一种基于批量语音识别和TTS文本合成的测试方法
本专利技术涉及一种语音识别测试方法,特别涉及一种以智能终端为目标,基于批量语音识别和TTS文本合成的测试方法,属于智能终端控制领域。
技术介绍
随着语音技术的成熟,很多通过语音进行控制的智能终端开始出现在我们的生活中,如智能音箱、智能手机语音助手、智能家电、智能玩具、智能汽车等,此类产品基于语音进行设备控制,使得使用过程更为方便,体验上更具有优势。目前,关于智能终端主要采用自动语音识别技术(ASR)进行语音到文字的测试,或者采用文本合成技术(TTS)进行文字到语音的测试,测试过程相对单一,测试范围主要局限在现有产品的标准功能测试上,测试目标简单,测试形式匮乏,在简单环境中语音识别的准确性和可靠性还可满足使用要求,但随着使用环境复杂化,语音识别过程受到较大考验,给多场景环境下智能终端使用的安全性带来较大隐患。于是,设计一套完整的测试手段,形成覆盖多场景、大批量语音识别和TTS文本合成的测试方法,就成为本专利技术想要解决的问题。
技术实现思路
鉴于上述现有情况和不足,本专利技术旨在提供一种将自动语音识别技术和TTS文本合成技 ...
【技术保护点】
1.一种基于批量语音识别和TTS文本合成的测试方法,其特征在于,具体步骤包括:步骤1、通过PC或云端启动测试脚本,根据待测智能终端选择要测试的功能,包括ASR功能或TTS功能;步骤2、推送PC或云端已配置好的系统配置文件和集成了ASR及TTS技术的测试APP到待测智能终端;步骤3、自动启动待测智能终端上的测试APP,根据系统配置文件调配测试ASR功能或TTS功能相关支持文件并存储在待测智能终端中,测试ASR功能支持文件包括识别语音信息、标准文本和语音识别模式,语音识别模式包括识别和唤醒两种模式;测试TTS功能支持文件包括TTS合成文本信息、TTS前端模型和TTS后端模型;步 ...
【技术特征摘要】
1.一种基于批量语音识别和TTS文本合成的测试方法,其特征在于,具体步骤包括:步骤1、通过PC或云端启动测试脚本,根据待测智能终端选择要测试的功能,包括ASR功能或TTS功能;步骤2、推送PC或云端已配置好的系统配置文件和集成了ASR及TTS技术的测试APP到待测智能终端;步骤3、自动启动待测智能终端上的测试APP,根据系统配置文件调配测试ASR功能或TTS功能相关支持文件并存储在待测智能终端中,测试ASR功能支持文件包括识别语音信息、标准文本和语音识别模式,语音识别模式包括识别和唤醒两种模式;测试TTS功能支持文件包括TTS合成文本信息、TTS前端模型和TTS后端模型;步骤4、如测试ASR功能:识别语音信息根据语音识别模式对获取的语音数据进行分割,并分段送入测试APP识别,根据识别或者唤醒模式,获取识别或唤醒结果,并将识别或唤醒结果保存到待测智能终端中;如测试TTS功能:根据TTS文本信息、TTS前端模型和TTS后端模型将待测文本信息送入进行合成,如文本合成成功,获取文本合成语音保存到待测智能终端中,然后将文本合成语音再进行ASR语音识别,获取语音识别后的ASR语音识别结果并保存到待测智能终端中;如文本合成失败,保存文本合成时的参数信息及合成失败的目标文本,再继续合成下一条数据,直至全部文本合成完成;步骤5、PC或云端自动获取...
【专利技术属性】
技术研发人员:马永飞,王道宁,马立民,
申请(专利权)人:北京易诚高科科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。