一种在语音合成系统中提升提示音匹配效果的智能方法技术方案

技术编号:3045399 阅读:175 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种在语音合成系统中提升提示音匹配效果的智能方法,实现了合成文本与提示音资源智能匹配,从而获得高质量语音。本发明专利技术包括建立提示音库资源及资源索引,在运用语音合成系统进行文本合成的过程中,经过提示音字符层匹配、拼音层匹配和自动构建,实现被合成文本与提示音资源的智能匹配,从而完成从文本到提示音的转换。本发明专利技术在语音合成过程中提高了提示音的利用效率,改进了提示音单纯从字符层匹配在实际应用中的不足,有效利用提示音库,做到既充分利用真人录音的自然流畅,又减少音库冗余,从而提高语音服务的品质。

【技术实现步骤摘要】

本专利技术涉及一种语音合成方法,具体涉及一种在使用计算机完成从文本到自然语音的转换过程中,将文本与预录语音智能匹配并输出高质量语音的方法。
技术介绍
目前,在IVR、呼叫中心等电话语音系统中,业务流程往往需要同时使用预录的提示音和合成语音。预录提示音采用真人录音,效果自然,并且能体现更多的情感风格,给用户以亲切感受。合成语音虽然清晰准确,但是在语气和情感方面还与真人录音存在一定的差距。在具体应用中,预录语音用于播报语音服务系统中相对固定的内容,通常是进系统的问候语和系统操作方法的提示。合成语音用于播报内容经常变化、信息量大、需要即时合成的文本。预录语音与合成语音结合,既可以满足电话语音服务中人性化的要求,又实现了动态信息的即时播报。目前语音合成系统中预录语音和合成语音相结合的策略是对用户输入的待合成文本,合成系统首先从字符层面上将该文本与提示音库中各提示音的文本相比较,如果完全匹配,则输出该提示音的音频数据;如果存在差异,则用语音合成引擎进行合成并输出合成语音。上述合成策略在实际应用中存在一定的缺陷,主要表现在1、由于合成文本与提示音文本必须在字符层面上完全匹配,用户如果将提示音句子中某个音节修改为具有同样拼音的其它汉字,则匹配不上。比如音库中已经录制了提示音“2、余额查询”,当用户输入的合成文本为“二、余额查询”,则不会匹配到前面那句提示音。2、对于相同意义的信息,如果存在全半角、标点符号和其它符号的差别,就需要逐条单独录音。在实际应用中,提示音数量巨大,如果每一条提示音信息都要从字符层面考虑,录制多条不同字符形式的提示语音,则会增加提示音库制作工作量,延长音库制作周期,同时也造成音库大量冗余,造成资源浪费。
技术实现思路
本专利技术的目的就是提供一种语音合成过程中提高提示音利用效率的方法,用于改进提示音单纯从字符层匹配在实际应用中的不足,有效利用提示音库,做到既充分利用真人录音的自然流畅,又减少音库冗余,从而提高语音服务的品质。本专利技术是通过以下技术方案实现的,包括根据预先录制的语音数据制作合成系统需要的提示音资源,提示音资源的制作包括建立提示音索引文件,索引文件包括每个提示音的名称、发音人、字符内容和语音数据的存放位置,然后用户向合成系统提供待合成文本信息,合成系统经字符层匹配,待合成文本的字符内容与提示音字符内容必须完全一致后即可输出合成语音数据,在运用合成系统进行文本合成的过程中,本专利技术还需要经过拼音层匹配和提示音自动构建的智能分析处理;索引文件还包括有拼音信息和提示音自动构建音库的语音数据存放路径。,在合成系统进行文本的合成过程中,首先进行字符层匹配,若字符层匹配没有成功,则进行拼音层匹配,若拼音层匹配也没有成功,则进行自动构建的智能分析处理。,所述的字符层匹配,以下三种情况中的任意一种或两种或三种情况出现也视为合成文本和提示音匹配成功(1)字符内容存在全半角的差异;(2)字符中间存在符号的差异,包括单引号、双引号、中划线、反斜线、书名号;(3)字符尾存在符号的差异,包括句号、感叹号、问号、分号,逗号。,所述的拼音层匹配是指通过检索提示音索引文件,判断待合成文本的拼音信息是否与某个提示音的的拼音信息完全相同,只有完全相同,才认为匹配成功,如果拼音层匹配成功,则根据提示音索引文件中提供的语音数据存放位置,提取语音数据进行合成播放。,所述的提示音自动构建音库的制作是通过工具,提取提示音资源的语音参数信息,并以二进制文件方式存储起来。,如果字符层、拼音层匹配都没有成功,合成系统根据待合成文本的信息,按照大语料库合成算法,从提示音自动构建音库中挑选语音基本单元进行波形拼接,最终输出语音数据进行播放。,所述的语音基本单元为词语。本专利技术的有益效果在于首先,提示音字符层匹配从原来的所有字符完全一模一样扩展到可以忽略全角半角、句末标点和其它句中符号;提示音拼音层匹配可以实现同音异符的文本;自动构建更是实现了提示音在词语一级的匹配和构建,这些改进有效增加了提示音匹配的成功率,减少用户由于对文本轻微的改动而需要再次录制提示音的代价,大大降低了提示音库制作的工作量。其次,语音合成系统在管理提示语音的过程中,采用科学算法保证提示语音和合成语音的自然过渡衔接,在合成系统内部自动处理语音的格式转化,并且提供了可视化工具帮助用户解决实际应用中的特殊要求,比如调整提示语音与合成语音的能量对比等。这些机制更好地满足了实际应用的灵活度和个性化要求。另外,本系统还提供面向行业的定制提示音库,满足不同行业提示音应用的需要。附图说明附图为提示音智能匹配工作流程框图。具体实施例方式参见附图。首先制作提示音资源并放到合成系统资源中,然后用户在语音合成系统中启用提示音功能,当输入合成文本后,合成系统会根据文本的特性,与提示音库中的提示音资源进行智能匹配,包含三个层次的匹配过程第一层是字符层匹配;第二层称作拼音层匹配,解决字符不同,但是拼音相同的提示音合成问题;第三层匹配称为提示音自动构建,解决大量提示音录制完毕后,怎样有效利用已有资源的问题。当任何一层匹配到时,就会调用相应的提示音语音数据进行拼接,从而输出语音数据。提示音智能匹配的实现步骤包括四个步骤提示音库资源制作、字符层匹配、拼音层匹配和自动构建。第一步,资源制作。在提示音智能匹配过程中,涉及到三个资源,具体为(1)提示音索引文件,用以记录所有录制的提示音条目,包括每个提示音的名称、发音人、字符内容、拼音信息、语音数据(指自动构建音库或打包资源)的存放路径等。(2)提示音自动构建音库,语音技术专业人员通过资源制作工具,提取提示音的语音参数信息,并以二进制文件方式存储起来,形成提示音音库;又由于这个过程是完全机器自动化,所以称这个音库为提示音自动构建音库。(3)提示音打包资源,有一些提示音数据,由于时间或者其它原因没有制作成自动构建音库,但这些提示音也需要以一种资源方式利用起来,这时用户就可以使用语音技术专业人员提供的工具将提示音语音数据(如wav等)打包,形成提示音打包资源;注意打包资源中的提示音只能用做字符层和拼音层匹配。第二步,字符层匹配。用户在合成系统中输入合成文本后,合成系统首先进行文本分析,包括分句、字符处理等操作,在文本分析后,系统就可以进行第一层匹配字符层匹配。字符层匹配的具体实现流程为根据当前合成的文本内容,从字符层面上比较文本的字符内容是否和某个提示音的字符内容相同,这里的相同包括以下几种情况(1)字符内容完全一样;(2)字符内容存在全半角的差异;(3)字符中间存在符号的差异;包括‘(单引号)、“”(双引号)、-(中划线)、/(反斜线)、<>(书名号);(4)字符尾存在符号的差异,包括句号、感叹号、问号、分号,逗号。举例假设有提示音“本奖励办法最终解释权属招商银行。”,用户输入以下几种改动后的文本,仍然会匹配到这句提示音(1)本奖励办法/最终解释权/属招商银行。(2)本奖励办法最终解释权属″招商银行″。(3)本奖励办法最终解释权属<招商银行>。(4)本奖励办法---最终解释权属招商银行?如果字符层匹配到,就会到提示音索引文件中获取其语音数据路径,根据路径从提示音自动构建库或者提示音打包资源中提取语音数据进本文档来自技高网
...

【技术保护点】
一种在语音合成系统中提升提示音匹配效果的智能方法,包括根据预先录制的语音数据制作合成系统需要的提示音资源,提示音资源的制作包括建立提示音索引文件,索引文件包括:每个提示音的名称、发音人、字符内容和语音数据的存放位置,然后用户向合成系统提供待合成文本信息,合成系统经字符层匹配,待合成文本的字符内容与提示音字符内容必须完全一致后即可输出合成语音数据,其特征在于运用合成系统进行文本合成的过程中,还需要经过拼音层匹配和提示音自动构建的智能分析处理;索引文件还包括有:拼音信息和提示音自动构建音库的语音数据存放路径。

【技术特征摘要】
1.一种在语音合成系统中提升提示音匹配效果的智能方法,包括根据预先录制的语音数据制作合成系统需要的提示音资源,提示音资源的制作包括建立提示音索引文件,索引文件包括每个提示音的名称、发音人、字符内容和语音数据的存放位置,然后用户向合成系统提供待合成文本信息,合成系统经字符层匹配,待合成文本的字符内容与提示音字符内容必须完全一致后即可输出合成语音数据,其特征在于运用合成系统进行文本合成的过程中,还需要经过拼音层匹配和提示音自动构建的智能分析处理;索引文件还包括有拼音信息和提示音自动构建音库的语音数据存放路径。2.根据权利要求1所述的一种在语音合成系统中提升提示音匹配效果的智能方法,其特征在于在合成系统进行文本的合成过程中,首先进行字符层匹配,若字符层匹配没有成功,则进行拼音层匹配,若拼音层匹配也没有成功,则进行自动构建的智能分析处理。3.根据权利要求1所述的一种在语音合成系统中提升提示音匹配效果的智能方法,其特征在于所述的字符层匹配,以下三种情况中的任意一种或两种或三种情况出现也视为合成文本和提示音匹配成功(1)字符内容存在全半角的差异;(2)字符中间存在符号的...

【专利技术属性】
技术研发人员:王仁华刘庆峰吴晓如严峻赵志伟熊厚余李文兵于继栋
申请(专利权)人:安徽中科大讯飞信息科技有限公司
类型:发明
国别省市:34[中国|安徽]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利