【技术实现步骤摘要】
本申请涉及语音合成,尤其涉及一种发音预测方法及相关装置。
技术介绍
1、目前的语音合成系统,首先会对待合成的文本进行分词,得到一个个独立的单词,再对各单词进行发音预测,确定各单词的发音信息,最后根据各单词的发音信息进行合成。其中,各单词的发音信息准确度对最终合成的效果起着至关重要的作用。
2、现有的发音预测方案一般采用检索语料资源库的方式,即预先构建语料资源库,语料资源库中收录有多个词的发音信息。在对分词后的单词进行发音预测时,可以直接从语料资源库中确定单词的发音信息。但是,分词后的某些词,语料资源库中收录的发音信息可能有多种,这种情况下,将无法准确确定这些词的发音信息。另外,还有些词,语料库中可能并未收录,这种情况下,现有的发音预测方案会采用其他手段(如,跳过本词不发音或填充静音段、采用按字母读、使用c45决策树等机器学习方法进行发音预测中的任一手段)对这些词的发音信息进行预测,但是这些词的形式多样,采用的手段可能无法准确确定出某些形式的词的发音信息。
3、因此,如何提供一种发音预测方法,以能够准确确定出待合成
...【技术保护点】
1.一种发音预测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于预设的语料资源库确定出第一类词的发音信息,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述分词序列中各个词的词性信息,确定各个第二类词的发音类别,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列,以及,所述词性信息注意力掩码序列,确定各个所述第二类词的发音类别,包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述分词序列、所
...【技术特征摘要】
1.一种发音预测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于预设的语料资源库确定出第一类词的发音信息,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述分词序列中各个词的词性信息,确定各个第二类词的发音类别,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列,以及,所述词性信息注意力掩码序列,确定各个所述第二类词的发音类别,包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述分词序列、所述发音信息序列、所述发音信息注意力掩码序列、所述词性信息序列,以及,所述词性信息注意力掩码序列,输入词性及发音类别预测模型,得到所述词性及发音类别预测模型...
【专利技术属性】
技术研发人员:李沛霖,朱荣华,蔡明琦,方昕,吴江照,高建清,
申请(专利权)人:合肥智能语音创新发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。