一种发音预测方法及相关装置制造方法及图纸

技术编号:43139911 阅读:18 留言:0更新日期:2024-10-29 17:43
本申请公开了一种发音预测方法及相关装置,首先对待合成的文本进行分词处理,得到分词序列,对于分词序列中的第一类词,将基于预设的语料资源库确定出第一类词的发音信息,对于分词序列中除第一类词之外的第二类词,基于分词序列中各个词的词性信息,确定其发音类别,基于与其发音类别对应的发音信息确定方式确定其发音信息。在本申请中,结合语料资源库以及预设的各发音类别对应的发音信息确定方式,能够涵盖各种情况下的发音信息确定,因此,能够准确确定出待合成文本中各词的发音信息,进而能够提升语音合成的效果。

【技术实现步骤摘要】

本申请涉及语音合成,尤其涉及一种发音预测方法及相关装置


技术介绍

1、目前的语音合成系统,首先会对待合成的文本进行分词,得到一个个独立的单词,再对各单词进行发音预测,确定各单词的发音信息,最后根据各单词的发音信息进行合成。其中,各单词的发音信息准确度对最终合成的效果起着至关重要的作用。

2、现有的发音预测方案一般采用检索语料资源库的方式,即预先构建语料资源库,语料资源库中收录有多个词的发音信息。在对分词后的单词进行发音预测时,可以直接从语料资源库中确定单词的发音信息。但是,分词后的某些词,语料资源库中收录的发音信息可能有多种,这种情况下,将无法准确确定这些词的发音信息。另外,还有些词,语料库中可能并未收录,这种情况下,现有的发音预测方案会采用其他手段(如,跳过本词不发音或填充静音段、采用按字母读、使用c45决策树等机器学习方法进行发音预测中的任一手段)对这些词的发音信息进行预测,但是这些词的形式多样,采用的手段可能无法准确确定出某些形式的词的发音信息。

3、因此,如何提供一种发音预测方法,以能够准确确定出待合成文本中各词的发音信息本文档来自技高网...

【技术保护点】

1.一种发音预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设的语料资源库确定出第一类词的发音信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述分词序列中各个词的词性信息,确定各个第二类词的发音类别,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列,以及,所述词性信息注意力掩码序列,确定各个所述第二类词的发音类别,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述分词序列、所述发音信息序列、所述...

【技术特征摘要】

1.一种发音预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设的语料资源库确定出第一类词的发音信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述分词序列中各个词的词性信息,确定各个第二类词的发音类别,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列,以及,所述词性信息注意力掩码序列,确定各个所述第二类词的发音类别,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列,以及,所述词性信息注意力掩码序列,输入词性及发音类别预测模型,得到所述词性及发音类别预测模型...

【专利技术属性】
技术研发人员:李沛霖朱荣华蔡明琦方昕吴江照高建清
申请(专利权)人:合肥智能语音创新发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1