泰语语音合成方法、装置以及设备制造方法及图纸

技术编号:28298112 阅读:27 留言:0更新日期:2021-04-30 16:24
本发明专利技术公开了一种泰语语音合成方法、装置以及设备,本发明专利技术的构思在于针对现有技术在文本前端进行韵律划分时切分的粒度控制不够精细、准确率低,尤其是粗糙的文本前端处理不能适应端到端合成技术的需求,导致合成的泰语语音不自然表现力低等问题,提出结合待合成文本的上下文信息、预设的单词匹配规则以及构建的音节切分模型分别对语句、词语、音节进行切分,一方面使得本发明专利技术涉及的韵律层级包含了更为全面的三个层级维度,另一方面使得各韵律层级的划分结果更为精细、准确。可见,本发明专利技术可以显著提升合成的泰语语音在诸如停顿、节奏等方面获得精准表现,从而使其听感更为自然,同时也有效适配了端到端合成处理的需求。

【技术实现步骤摘要】
泰语语音合成方法、装置以及设备
本专利技术语音合成领域,尤其涉及一种泰语语音合成方法、装置以及设备。
技术介绍
近年来,语音合成在数字交流中扮演着越来越重要的角色。虽然世界上主要语种的语音合成系统已经成熟并商业化,但这项技术仍然在不断发展和进步。泰语又称傣语,是东亚语系的一种,世界上约6800万人在使用泰语交流。泰语语音合成自上世纪90年代便已开始,但最初仅仅是一种基于单元挑选的拼接系统,合成的泰语语音机械感强烈。为解决此问题,本领域在现有研究和尝试中,提出针对泰语独特的语言特点对泰语文本进行韵律层级的划分,具体来说,泰语是一种声调语言,其特点包括但不限于具有4个显式的声调标记,但实际包含5个声调,并且泰语文本通常没有明确的单词和语句分割标识。由此可知,针对泰语合成而言,如何切分待合成泰语文本中的句、词乃至音节,则会对合成的泰语语音产生关键的影响,因为句子、单词、音节的划分直接作用于韵律层面的合成效果,即其可以体现出泰语合成语音中诸如停顿、节奏感等听觉感受。现有的泰语韵律建模思想均是围绕语音合成领域中传统的声学模型开展的,具体而本文档来自技高网...

【技术保护点】
1.一种泰语语音合成方法,其特征在于,包括:/n结合待合成泰语文本的上下文信息,对所述待合成泰语文本进行分句;/n基于预设的匹配规则,对所述待合成泰语文本进行分词;/n利用预设的音节切分策略,对所述待合成泰语文本进行分音节;/n根据经由分句、分词、分音节处理后的所述待合成泰语文本以及预先训练的端到端语音合成模型,得到泰语合成语音。/n

【技术特征摘要】
1.一种泰语语音合成方法,其特征在于,包括:
结合待合成泰语文本的上下文信息,对所述待合成泰语文本进行分句;
基于预设的匹配规则,对所述待合成泰语文本进行分词;
利用预设的音节切分策略,对所述待合成泰语文本进行分音节;
根据经由分句、分词、分音节处理后的所述待合成泰语文本以及预先训练的端到端语音合成模型,得到泰语合成语音。


2.根据权利要求1所述的泰语语音合成方法,其特征在于,所述结合待合成泰语文本的上下文信息,对所述待合成泰语文本进行分句包括:
以字符为单位,获得所述待合成泰语文本中各待处理字符的若干上下文字符;
基于泰语句式规则,对所述待处理字符和/或所述上下文字符进行预标记;
结合所述上下文字符、预标记结果以及预先构建的分句模型,确定所述待处理字符是否为语句结束字符。


3.根据权利要求2所述的泰语语音合成方法,其特征在于,所述获得所述待合成泰语文本中各待处理字符的若干上下文字符包括:
利用预设尺寸的滑窗,从所述待合成泰语文本中选定以待处理字符为中心的若干个目标字符;
对各所述目标字符进行拓展,得到若干个上下文字符。


4.根据权利要求2所述的泰语语音合成方法,其特征在于,所述预标记的方式包括:
将所述待处理字符和/或所述上下文字符,与预设的语句首尾字符库进行匹配;
确定并标记出所述待处理字符和/或各所述上下文字符是否为语句首尾字符。


5.根据权利要求1~4任一项所述的泰语语音合成方法,其特征在于,所述基于预设的匹配规则,对所述待合成泰语文本进行分词包括:
利用预设的泰语字典,按序从所述待合成泰语文本中匹配出若干候选词语;
将当前所述候选词语与预设的泰语单词模式进行二次匹配,判定当前所述候选...

【专利技术属性】
技术研发人员:陈梦楠高丽祖漪清江源
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1