一种模拟发声方法及模拟发声系统技术方案

技术编号:18117195 阅读:50 留言:0更新日期:2018-06-03 09:19
本发明专利技术公开了一种模拟发声方法及模拟发声系统,属于语音合成技术领域;方法包括获取一待发声文本;将待发声文本中的文字分别转化成对应的基本音子,以形成包括依序排列的多个基本音子的音子序列;于音子序列中区分出隶属于中文音标的基本音子以及隶属于英文音标的基本音子;根据对应关系将音子序列中隶属于中文音标的基本音子转换成对应的隶属于英文音标的基本音子,以形成一仅包括隶属于英文音标的基本音子的待发声序列;将待发声序列送入语音合成引擎中,以合成对应于待发声文本的一段语音并输出。上述技术方案的有益效果是:采用一个语音合成引擎实现中英文混合语音的模拟发声,降低模拟发声处理的复杂度,保证模拟发声的准确性。

【技术实现步骤摘要】
一种模拟发声方法及模拟发声系统
本专利技术涉及语音合成
,尤其涉及一种模拟发声方法及模拟发声系统。
技术介绍
随着计算机技术的飞速发展以及语音识别技术的日渐成熟,语音合成技术也得到了巨大的发展和进步。语音合成技术能够广泛应用到人们的日常生活中,出现了很多例如有声小说、有声新闻、天气播报以及字典朗读等的语音合成并模拟发声的应用,给人们的日常生活带来了很多便利和娱乐乐趣。现有的语音合成技术在可懂度和区分度上都能够满足日常应用的需求,但是目前的语音合成技术通常只针对一种语音进行,例如仅针对中文或者仅针对英文。少部分同时支持中英文双语的语音合成引擎通常的做法是:对两个音色相近的中文/英文说话人,或者同一个中英文发音都很流利的说话人进行语音采样,并分别建立中文/英文语音合成模型,在语音合成的时候针对中文/英文分别套用两套语音合成模型分别进行语音合成,最后再将中文/英文的合成结果进行组合并得到最终的语音合成结果。但是现有技术中,对于面向英美用户的英文语音合成引擎(TextToSpeech,TTS),一般很难找到音色合适又能流利说中文的英语母语的说话人,也较难找到音色与英文母语的说话人音色近似的中文说话人。因此,专用的英文语音合成引擎对于模拟中文发音的语音合成通常无能为力。
技术实现思路
根据现有技术中存在的上述问题,现提供一种模拟发声方法及模拟发声系统的技术方案,旨在采用一个语音合成引擎就能较好地实现中英文混合语音的模拟发声处理,降低了模拟发声处理的复杂度,并且保证模拟发声的准确性。上述技术方案具体包括:一种模拟发声方法,其中,设置一基于英文音标的语音合成引擎,并预先建立英文音标与中文音标之间的对应关系,还包括:步骤S1,获取一待发声文本;步骤S2,将所述待发声文本中的文字分别转化成对应的基本音子,以形成包括依序排列的多个所述基本音子的音子序列;步骤S3,于所述音子序列中区分出隶属于中文音标的所述基本音子以及隶属于英文音标的所述基本音子;步骤S4,根据所述对应关系将所述音子序列中隶属于中文音标的所述基本音子转换成对应的隶属于英文音标的所述基本音子,以形成一仅包括隶属于英文音标的所述基本音子的待发声序列;步骤S5,将所述待发声序列送入所述语音合成引擎中,以合成对应于所述待发声文本的一段语音并输出。优选的,该模拟发声方法,其中,所述步骤S4中具体包括:步骤S41,判断隶属于中文音标的所述基本音子的类别:若所述基本音子为隶属于中文韵母的第一基本音子,则转向步骤S42;若所述基本音子为隶属于中文声母的第二基本音子,则转向步骤S43;步骤S42,采用对应的英文音标替代所述第二基本音子,随后转向步骤S44;步骤S43,判断所述第二基本音子是否符合预设的匹配策略:若是,则对英文音标进行处理,并将经过处理的英文音标替代所述第二基本音子,随后转向步骤S44;若否,则采用对应的英文音标替代所述第二基本音子,随后转向步骤S44;步骤S44,将包括在所述音子序列中的所有隶属于中文音标的所述基本音子转换成对应的英文音标后,形成仅包括隶属于英文音标的所述基本音子的所述待发声序列,随后转向所述步骤S5。优选的,该模拟发声方法,其中,所述步骤S43中,当所述预设的匹配策略包括所述第二基本音子属于中文声母的送气音类型时,采用在对应于所述第二基本音子的英文音标后增加清辅音的方式替代所述第二基本音子。优选的,该模拟发声方法,其中,所述步骤S43中,当所述预设的匹配策略包括所述第二基本音子为中文声母中的ü时,采用在英文音标j后增加英文音标u的方式替代所述第二基本音子。优选的,该模拟发声方法,其中,所述步骤S43中,当所述预设的匹配策略包括所述第二基本音子满足一预设的条件时,采用预定的英文音标替代所述第二基本音子;所述预设的条件包括:所述第二基本音子属于中文声母中的声母音子集合{j,zh};或者所述第二基本音子属于中文声母中的声母音子集合{q,ch};或者所述第二基本音子属于中文声母中的声母音子集合{x,sh}。优选的,该模拟发声方法,其中,在执行所述步骤S42之前,首先执行下述步骤:步骤S421,判断所述第一基本音子是否为一预定的中文韵母:若否,则继续执行所述步骤S42;步骤S422,判断所述第一基本音子之前的所述基本音子是否属于一预设的中文声母集合:若否,则继续执行所述步骤S42;步骤S423,采用一预设的浊音英文音标替代所述第一基本音子,随后转向所述步骤S44。优选的,该模拟发声方法,其中,所述步骤S421中,预定的所述中文韵母为i。优选的,该模拟发声方法,其中,所述步骤S423中,预设的所述中文声母集合为{z,c,s}或者{zh,ch,sh}。一种模拟发声系统,其中,采用上述的模拟发声方法。上述技术方案的有益效果是:采用一个语音合成引擎就能较好地实现中英文混合语音的模拟发声处理,降低了模拟发声处理的复杂度,并且保证模拟发声的准确性。附图说明图1是本专利技术的较佳的实施例中,一种模拟发声方法的总体流程示意图;图2是现有技术中,中文音标中的声母发音部分示意图;图3是现有技术中,中文音标中的韵母发音部分示意图;图4是现有技术中,英文音标的国际音标分类示意图;图5是本专利技术的较佳的实施例中,将隶属于中文音标的基本音子转换为隶属于英文音标的基本音子的流程示意图;图6是本专利技术的较佳的实施例中,对某种隶属于中文韵母的第一基本音子进行转换的流程示意图;图7是本专利技术的较佳的实施例中,关于汉语拼音中的声母j、q、x和zh、ch、sh之间互补性的示意图;图8是本专利技术的一个较佳的实施例中,采用英文音子替代中文音子的映射关系示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。基于现有技术中存在的上述问题,现提供一种模拟发声方法的技术方案,该模拟发声方法主要针对同时具有中文文本和英文文本的中英文混合文本进行模拟发声操作,具体在于采用英文的基本音子来替代掉混合文本中相应的中文的基本音子,从而形成一个仅包括英文基本音子的音子序列,再对这个音子序列进行模拟发声,则能够仅依靠包括英文音标的语音合成引擎实现中英文混合语音的模拟发声操作。当然,本技术方案同样适用于仅包括中文的文本的模拟发声操作(将所有中文音标替换成对应的英文音标),或者适用于仅包括英文的文本的模拟发声操作(直接采用仅包括英文的语音合成引擎进行模拟发声操作),即本技术方案在解决中英文混合语音的模拟发声问题的同时,依然能够适用于仅包括中文或者仅包括英文的文本的模拟发声。则本专利技术的较佳的实施例中,上述模拟发声方法中,首先设置一基于英文音标的语音合成引擎,并预先建立英文音标与中文音标之间的对应关系。上述方法的具体步骤如图1所示,包括:步骤S1,获取一待发声文本;步骤S2,将待发声文本中的文字分别转化成对应的基本音子,以形成包括依序排列的多个基本音子的音本文档来自技高网...
一种模拟发声方法及模拟发声系统

【技术保护点】
一种模拟发声方法,其特征在于,设置一基于英文音标的语音合成引擎,并预先建立英文音标与中文音标之间的对应关系,还包括:步骤S1,获取一待发声文本;步骤S2,将所述待发声文本中的文字分别转化成对应的基本音子,以形成包括依序排列的多个所述基本音子的音子序列;步骤S3,于所述音子序列中区分出隶属于中文音标的所述基本音子以及隶属于英文音标的所述基本音子;步骤S4,根据所述对应关系将所述音子序列中隶属于中文音标的所述基本音子转换成对应的隶属于英文音标的所述基本音子,以形成一仅包括隶属于英文音标的所述基本音子的待发声序列;步骤S5,将所述待发声序列送入所述语音合成引擎中,以合成对应于所述待发声文本的一段语音并输出。

【技术特征摘要】
1.一种模拟发声方法,其特征在于,设置一基于英文音标的语音合成引擎,并预先建立英文音标与中文音标之间的对应关系,还包括:步骤S1,获取一待发声文本;步骤S2,将所述待发声文本中的文字分别转化成对应的基本音子,以形成包括依序排列的多个所述基本音子的音子序列;步骤S3,于所述音子序列中区分出隶属于中文音标的所述基本音子以及隶属于英文音标的所述基本音子;步骤S4,根据所述对应关系将所述音子序列中隶属于中文音标的所述基本音子转换成对应的隶属于英文音标的所述基本音子,以形成一仅包括隶属于英文音标的所述基本音子的待发声序列;步骤S5,将所述待发声序列送入所述语音合成引擎中,以合成对应于所述待发声文本的一段语音并输出。2.如权利要求1所述的模拟发声方法,其特征在于,所述步骤S4中具体包括:步骤S41,判断隶属于中文音标的所述基本音子的类别:若所述基本音子为隶属于中文韵母的第一基本音子,则转向步骤S42;若所述基本音子为隶属于中文声母的第二基本音子,则转向步骤S43;步骤S42,采用对应的英文音标替代所述第二基本音子,随后转向步骤S44;步骤S43,判断所述第二基本音子是否符合预设的匹配策略:若是,则对英文音标进行处理,并将经过处理的英文音标替代所述第二基本音子,随后转向步骤S44;若否,则采用对应的英文音标替代所述第二基本音子,随后转向步骤S44;步骤S44,将包括在所述音子序列中的所有隶属于中文音标的所述基本音子转换成对应的英文音标后,形成仅包括隶属于英文音标的所述基本音子的所述待发声序列,随后转向所述步骤S5。3.如权利要求2所述的模拟发声方法,其特征在于,所述步骤S43...

【专利技术属性】
技术研发人员:孟猛
申请(专利权)人:芋头科技杭州有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1