一种重音预测方法、装置、设备及存储介质制造方法及图纸

技术编号:34090810 阅读:36 留言:0更新日期:2022-07-11 21:08
本申请提供了一种重音预测方法、装置、设备及存储介质,其中,方法包括:获取待预测重音的文本数据;对文本数据进行分词,得到分词单元;对每个分词单元进行词干词缀切分,并将每个分词单元与前后相邻分词单元的词缀进行拼接,得到文本数据对应的拼接结果;根据文本数据对应的拼接结果,预测文本数据中每个分词单元的重音位置。本申请提供的重音预测方法将文本数据的每个分词单元与前后相邻分词单元的词缀进行拼接,相当于针对文本数据中的每个分词单元引入了语境信息,在对每个分词单元进行重音预测时,引入语境信息能够较好的区分同形异音词,进而准确地预测出重音位置。进而准确地预测出重音位置。进而准确地预测出重音位置。

【技术实现步骤摘要】
一种重音预测方法、装置、设备及存储介质


[0001]本申请涉及语音合成
,尤其涉及一种重音预测方法、装置、设备及存储介质。

技术介绍

[0002]预测文本数据中的重音位置是语音合成至关重要的一步。现有的重音预测方案主要为,根据待预测重音的文本数据中每个词条的文本特征(比如,词条本身、词条长度、词条的词性等)预测每个词条的重音位置。
[0003]现有的重音预测方案虽然能够预测出文本数据的重音位置,但是,其对于同形异音词的预测准确度不高。可以理解的是,重音位置预测的正确与否直接影响合成语音的可懂度和表现力,若重音位置预测错误,将直接影响后+ 续合成语音的质量。

技术实现思路

[0004]有鉴于此,本申请提供了一种重音预测方法、装置、设备及存储介质,用以解决现有的重音预测方案对于同形异音词的预测准确度不高的问题,其技术方案如下:
[0005]一种重音预测方法,包括:
[0006]获取待预测重音的文本数据;
[0007]对所述文本数据进行分词,得到分词单元;
[0008]对每个分词单元进行词本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种重音预测方法,其特征在于,包括:获取待预测重音的文本数据;对所述文本数据进行分词,得到分词单元;对每个分词单元进行词干词缀切分,并将每个分词单元与前后相邻分词单元的词缀进行拼接,得到所述文本数据对应的拼接结果;根据所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置。2.根据权利要求1所述的重音预测方法,其特征在于,所述根据所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置,包括:利用预先构建的重音预测模块和所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置。3.根据权利要求2所述的重音预测方法,其特征在于,所述利用预先构建的重音预测模块和所述文本数据对应的拼接结果,预测所述文本数据中每个分词单元的重音位置,包括:对所述文本数据对应的拼接结果中的每个拼接单元进行独热编码;将所述每个拼接单元的编码结果输入预先构建的重音预测模块,得到所述每个拼接单元对应的重音预测结果,其中,所述重音预测结果用于指示对应的拼接单元所包含的每个字符处是否为重音位置;根据所述每个拼接单元对应的重音预测结果,确定所述文本数据中每个分词单元的重音位置。4.根据权利要求3所述的重音预测方法,其特征在于,所述对所述文本数据对应的拼接结果中的每个拼接单元进行独热编码,包括:根据构建的状态集,对所述文本数据对应的拼接结果中的每个拼接单元进行独热编码;其中,所述状态集为由指定字符和所述文本数据所属语种包含的字符组成的字符集合,所述指定字符包括分词符、词干词缀分隔符和无词缀提示符。5.根据权利要求1所述的重音预测方法,其特征在于,所述将每个分词单元与前后相邻分词单元的词缀进行拼接,包括:针对所述文本数据中的每个分词单元:若该分词单元之前不存在可拼接词缀,该分词单元之后存在可拼接词缀,...

【专利技术属性】
技术研发人员:张逸杰刘聪江源祖漪清高丽
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1