一种发音预测方法及相关装置制造方法及图纸

技术编号：43139911 阅读：18 留言：0更新日期：2024-10-29 17:43

本申请公开了一种发音预测方法及相关装置，首先对待合成的文本进行分词处理，得到分词序列，对于分词序列中的第一类词，将基于预设的语料资源库确定出第一类词的发音信息，对于分词序列中除第一类词之外的第二类词，基于分词序列中各个词的词性信息，确定其发音类别，基于与其发音类别对应的发音信息确定方式确定其发音信息。在本申请中，结合语料资源库以及预设的各发音类别对应的发音信息确定方式，能够涵盖各种情况下的发音信息确定，因此，能够准确确定出待合成文本中各词的发音信息，进而能够提升语音合成的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音合成，尤其涉及一种发音预测方法及相关装置。

技术介绍

1、目前的语音合成系统，首先会对待合成的文本进行分词，得到一个个独立的单词，再对各单词进行发音预测，确定各单词的发音信息，最后根据各单词的发音信息进行合成。其中，各单词的发音信息准确度对最终合成的效果起着至关重要的作用。

2、现有的发音预测方案一般采用检索语料资源库的方式，即预先构建语料资源库，语料资源库中收录有多个词的发音信息。在对分词后的单词进行发音预测时，可以直接从语料资源库中确定单词的发音信息。但是，分词后的某些词，语料资源库中收录的发音信息可能有多种，这种情况下，将无法准确确定这些词的发音信息。另外，还有些词，语料库中可能并未收录，这种情况下，现有的发音预测方案会采用其他手段(如，跳过本词不发音或填充静音段、采用按字母读、使用c45决策树等机器学习方法进行发音预测中的任一手段)对这些词的发音信息进行预测，但是这些词的形式多样，采用的手段可能无法准确确定出某些形式的词的发音信息。

3、因此，如何提供一种发音预测方法，以能够准确确定出待合成...

【技术保护点】

1.一种发音预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预设的语料资源库确定出第一类词的发音信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述分词序列中各个词的词性信息，确定各个第二类词的发音类别，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列，以及，所述词性信息注意力掩码序列，确定各个所述第二类词的发音类别，包括：

5.根据权利要求4所述的方法，其特征在于，所述将所述分词序列、所述发音信息序列、所述...

【技术特征摘要】

1.一种发音预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预设的语料资源库确定出第一类词的发音信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述分词序列中各个词的词性信息，确定各个第二类词的发音类别，包括：

5.根据权利要求4所述的方法，其特征在于，所述将所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列，以及，所述词性信息注意力掩码序列，输入词性及发音类别预测模型，得到所述词性及发音类别预测模型...

【专利技术属性】
技术研发人员：李沛霖，朱荣华，蔡明琦，方昕，吴江照，高建清，
申请(专利权)人：合肥智能语音创新发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人