一种模拟发声方法及模拟发声系统技术方案

技术编号：18117195 阅读：50 留言：0更新日期：2018-06-03 09:19

本发明专利技术公开了一种模拟发声方法及模拟发声系统，属于语音合成技术领域；方法包括获取一待发声文本；将待发声文本中的文字分别转化成对应的基本音子，以形成包括依序排列的多个基本音子的音子序列；于音子序列中区分出隶属于中文音标的基本音子以及隶属于英文音标的基本音子；根据对应关系将音子序列中隶属于中文音标的基本音子转换成对应的隶属于英文音标的基本音子，以形成一仅包括隶属于英文音标的基本音子的待发声序列；将待发声序列送入语音合成引擎中，以合成对应于待发声文本的一段语音并输出。上述技术方案的有益效果是：采用一个语音合成引擎实现中英文混合语音的模拟发声，降低模拟发声处理的复杂度，保证模拟发声的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种模拟发声方法及模拟发声系统
本专利技术涉及语音合成
，尤其涉及一种模拟发声方法及模拟发声系统。
技术介绍
随着计算机技术的飞速发展以及语音识别技术的日渐成熟，语音合成技术也得到了巨大的发展和进步。语音合成技术能够广泛应用到人们的日常生活中，出现了很多例如有声小说、有声新闻、天气播报以及字典朗读等的语音合成并模拟发声的应用，给人们的日常生活带来了很多便利和娱乐乐趣。现有的语音合成技术在可懂度和区分度上都能够满足日常应用的需求，但是目前的语音合成技术通常只针对一种语音进行，例如仅针对中文或者仅针对英文。少部分同时支持中英文双语的语音合成引擎通常的做法是：对两个音色相近的中文/英文说话人，或者同一个中英文发音都很流利的说话人进行语音采样，并分别建立中文/英文语音合成模型，在语音合成的时候针对中文/英文分别套用两套语音合成模型分别进行语音合成，最后再将中文/英文的合成结果进行组合并得到最终的语音合成结果。但是现有技术中，对于面向英美用户的英文语音合成引擎(TextToSpeech，TTS)，一般很难找到音色合适又能流利说中文的英语母语的说话人，也较难找到音色与英文母语的说话人音色近似的中文说话人。因此，专用的英文语音合成引擎对于模拟中文发音的语音合成通常无能为力。
技术实现思路
根据现有技术中存在的上述问题，现提供一种模拟发声方法及模拟发声系统的技术方案，旨在采用一个语音合成引擎就能较好地实现中英文混合语音的模拟发声处理，降低了模拟发声处理的复杂度，并且保证模拟发声的准确性。上述技术方案具体包括：一种模拟发声方法，其中，设置一基于英文音标的语音合成引擎，并预...
一种模拟发声方法及模拟发声系统

【技术保护点】
一种模拟发声方法，其特征在于，设置一基于英文音标的语音合成引擎，并预先建立英文音标与中文音标之间的对应关系，还包括：步骤S1，获取一待发声文本；步骤S2，将所述待发声文本中的文字分别转化成对应的基本音子，以形成包括依序排列的多个所述基本音子的音子序列；步骤S3，于所述音子序列中区分出隶属于中文音标的所述基本音子以及隶属于英文音标的所述基本音子；步骤S4，根据所述对应关系将所述音子序列中隶属于中文音标的所述基本音子转换成对应的隶属于英文音标的所述基本音子，以形成一仅包括隶属于英文音标的所述基本音子的待发声序列；步骤S5，将所述待发声序列送入所述语音合成引擎中，以合成对应于所述待发声文本的一段语音并输出。

【技术特征摘要】
1.一种模拟发声方法，其特征在于，设置一基于英文音标的语音合成引擎，并预先建立英文音标与中文音标之间的对应关系，还包括：步骤S1，获取一待发声文本；步骤S2，将所述待发声文本中的文字分别转化成对应的基本音子，以形成包括依序排列的多个所述基本音子的音子序列；步骤S3，于所述音子序列中区分出隶属于中文音标的所述基本音子以及隶属于英文音标的所述基本音子；步骤S4，根据所述对应关系将所述音子序列中隶属于中文音标的所述基本音子转换成对应的隶属于英文音标的所述基本音子，以形成一仅包括隶属于英文音标的所述基本音子的待发声序列；步骤S5，将所述待发声序列送入所述语音合成引擎中，以合成对应于所述待发声文本的一段语音并输出。2.如权利要求1所述的模拟发声方法，其特征在于，所述步骤S4中具体包括：步骤S41，判断隶属于中文音标的所述基本音子的类别：若所述基本音子为隶属于中文韵母的第一基本音子，则转向步骤S42；若所述基本音子为隶属于中文声母的第二基本音子，则转向步骤S43；步骤S42，采用对应的英文音标替代所述第二基本音子，随后转向步骤S44；步骤S43，判断所述第二基本音子是否符合预设的匹配策略：若是，则对英文音标进行处理，并将经过处理的英文音标替代所述第二基本音子，随后转向步骤S44；若否，则采用对应的英文音标替代所述第二基本音子，随后转向步骤S44；步骤S44，将包括在所述音子序列中的所有隶属于中文音标的所述基本音子转换成对应的英文音标后，形成仅包括隶属于英文音标的所述基本音子的所述待发声序列，随后转向所述步骤S5。3.如权利要求2所述的模拟发声方法，其特征在于，所述步骤S43...

【专利技术属性】
技术研发人员：孟猛，
申请(专利权)人：芋头科技杭州有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人