语音合成停顿预测方法及装置、电子设备和存储介质制造方法及图纸

技术编号:39190300 阅读:8 留言:0更新日期:2023-10-27 08:37
本公开涉及语音合成停顿预测方法及装置、电子设备和存储介质,该方法包括:对输入文本进行分词处理,确定所述输入文本中的词;获取各所述词对应的第一特征,所述第一特征表征所述词的语义;获取各所述词的第二特征,所述第二特征表征所述词的实体关系;根据所述第一特征和所述第二特征,确定所述词的停顿方式。这样,使用本方法可以提高确定词的停顿方式的准确性。确性。确性。

【技术实现步骤摘要】
语音合成停顿预测方法及装置、电子设备和存储介质


[0001]本公开涉及人工智能
,尤其涉及一种语音合成停顿预测方法及装置、电子设备和存储介质。

技术介绍

[0002]语音合成是通过机械的、电子的方法产生人造语音的技术。文语转换技术(Text To Speech,TTS)隶属于语音合成,是将计算机自己产生的、或外部输入的文字信息转变为口语语音输出的技术。
[0003]随着科技加快发展、生活方式不断变化,“新词”、“热词”频出。因此,现有的语音合成系统无法适应词语的更新速度。语音合成系统无法准确地预测“新词”、“热词”的停顿,降低了语音的清晰度、可懂度。

技术实现思路

[0004]有鉴于此,本公开提出了一种语音合成停顿预测方案。
[0005]根据本公开的一方面,提供了一种语音合成停顿预测方法,包括:
[0006]对输入文本进行分词处理,确定所述输入文本中的词;
[0007]获取各所述词对应的第一特征,所述第一特征表征所述词的语义;
[0008]获取各所述词的第二特征,所述第二特征表征所述词的实体关系;
[0009]根据所述第一特征和所述第二特征,确定所述词的停顿方式。
[0010]在一种可能的实现方式中,所述对获取各所述词的第二特征,所述第二特征表征所述词的实体关系,包括:
[0011]在所述输入文本中,识别各所述词是否为预存词汇,得到识别结果;
[0012]根据各所述词的识别结果,确定各所述词的第二特征。
[0013]在一种可能的实现方式中,所述在所述输入文本中,识别各所述词是否为预存词汇,包括:
[0014]在所述输入文本中,存在与预存词汇匹配的第一词的情况下,确定所述第一词为预存词汇;
[0015]在所述输入文本中,存在与预存词汇不匹配的第二词的情况下,将所述第二词确定为非预存词汇。
[0016]在一种可能的实现方式中,所述根据各所述词的识别结果,确定各所述词的第二特征,包括:
[0017]在所述词为预存词汇的情况下,以第一标识标注所述词中的字;
[0018]在所述词为非预存词汇的情况下,以第二标识标注所述词中的字;
[0019]根据所述词中各字的所述第一标识或所述第二标识,构建各所述词的第二特征。
[0020]在一种可能的实现方式中,所述根据各所述词的识别结果,确定各所述词的第二特征,包括:
[0021]在所述输入文本中包含第一词和第二词,所述第一词与所述第二词均包括第一字,当所述第一词在所述词为预存词汇的情况下,以第一标识标注所述第一字,且当所述第二词为非预存词汇的情况下,以所述第一标识标注所述第一字。
[0022]在一种可能的实现方式中,所述根据所述第一特征和所述第二特征,确定所述词的停顿方式,包括:
[0023]将同一所述词的第二特征连接在第二特征之后,得到拼接特征;
[0024]根据各所述拼接特征,确定各所述词的停顿时长。
[0025]在一种可能的实现方式中,所述根据各所述拼接特征,确定各所述词的停顿时长,包括:
[0026]根据各所述拼接特征,确定各所述词的语义和上下文语义信息;
[0027]根据所述语义和所述上下文语义信息,确定各所述词的停顿时长。
[0028]在一种可能的实现方式中,所述根据各所述拼接特征,确定各所述词的语义和上下文语义信息,包括:
[0029]获取各所述词的拼接特征;
[0030]对各所述拼接特征进行编码,得到各第一编码,单个所述第一编码表征单个所述词的语义和上下文语义信息。
[0031]在一种可能的实现方式中,所述预存词汇位于预先构建的知识图谱中,所述方法还包括:
[0032]获取近期预定时间段内新出现的词;
[0033]利用新出现的词,更新所述知识图谱。
[0034]根据本公开的一方面,提供了一种语音合成停顿预测装置,包括:
[0035]词确定单元,用于对输入文本进行分词处理,确定所述输入文本中的词;
[0036]第一特征确定单元,用于获取各所述词对应的第一特征,所述第一特征表征所述词的语义;
[0037]第二特征确定单元,用于获取各所述词的第二特征,所述第二特征表征所述词的实体关系;
[0038]停顿方式确定单元,用于根据所述第一特征和所述第二特征,确定所述词的停顿方式。
[0039]在一种可能的实现方式中,所述第二特征确定单元,包括:
[0040]识别结果确定单元,用于在所述输入文本中,识别各所述词是否为预存词汇,得到识别结果;
[0041]第二特征确定子单元,用于根据各所述词的识别结果,确定各所述词的第二特征。
[0042]在一种可能的实现方式中,所述识别结果确定单元,包括:
[0043]预存词汇判断单元,用于在所述输入文本中,存在与预存词汇匹配的第一词的情况下,确定所述第一词为预存词汇;
[0044]非预存词汇确定单元,用于在所述输入文本中,存在与预存词汇不匹配的第二词的情况下,将所述第二词确定为非预存词汇。
[0045]在一种可能的实现方式中,所述第二特征确定子单元,包括:
[0046]第一标注单元,用于在所述词为预存词汇的情况下,以第一标识标注所述词中的
字;
[0047]第二标注单元,用于在所述词为非预存词汇的情况下,以第二标识标注所述词中的字;
[0048]第二特征构建单元,用于根据所述词中各字的所述第一标识或所述第二标识,构建各所述词的第二特征。
[0049]在一种可能的实现方式中,第二特征确定子单元,包括:
[0050]第三标注单元,用于在所述输入文本中包含第一词和第二词,所述第一词与所述第二词均包括第一字,当所述第一词在所述词为预存词汇的情况下,以第一标识标注所述第一字,且当所述第二词为非预存词汇的情况下,以所述第一标识标注所述第一字。
[0051]在一种可能的实现方式中,所述停顿方式确定单元,包括:
[0052]拼接特征确定单元,用于将同一所述词的第二特征连接在第二特征之后,得到拼接特征;
[0053]停顿时长确定单元,用于根据各所述拼接特征,确定各所述词的停顿时长。
[0054]在一种可能的实现方式中,所述停顿时长确定单元,包括:
[0055]语义确定单元,用于根据各所述拼接特征,确定各所述词的语义和上下文语义信息;
[0056]停顿时长确定子单元,用于根据所述语义和所述上下文语义信息,确定各所述词的停顿时长。
[0057]在一种可能的实现方式中,所述语义确定单元,包括:
[0058]拼接特征获取单元,用于获取各所述词的拼接特征;
[0059]语义确定子单元,用于对各所述拼接特征进行编码,得到各第一编码,单个所述第一编码表征单个所述词的语义和上下文语义信息。
[0060]在一种可能的实现方式中,所述预存词汇本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音合成停顿预测方法,其特征在于,包括:对输入文本进行分词处理,确定所述输入文本中的词;获取各所述词对应的第一特征,所述第一特征表征所述词的语义;获取各所述词的第二特征,所述第二特征表征所述词的实体关系;根据所述第一特征和所述第二特征,确定所述词的停顿方式。2.根据权利要求1所述的方法,其特征在于,所述对获取各所述词的第二特征,所述第二特征表征所述词的实体关系,包括:在所述输入文本中,识别各所述词是否为预存词汇,得到识别结果;根据各所述词的识别结果,确定各所述词的第二特征。3.根据权利要求2所述的方法,其特征在于,所述在所述输入文本中,识别各所述词是否为预存词汇,包括:在所述输入文本中,存在与预存词汇匹配的第一词的情况下,确定所述第一词为预存词汇;在所述输入文本中,存在与预存词汇不匹配的第二词的情况下,将所述第二词确定为非预存词汇。4.根据权利要求3所述的方法,其特征在于,所述根据各所述词的识别结果,确定各所述词的第二特征,包括:在所述词为预存词汇的情况下,以第一标识标注所述词中的字;在所述词为非预存词汇的情况下,以第二标识标注所述词中的字;根据所述词中各字的所述第一标识或所述第二标识,构建各所述词的第二特征。5.根据权利要求2所述的方法,其特征在于,所述根据各所述词的识别结果,确定各所述词的第二特征,包括:在所述输入文本中包含第一词和第二词,所述第一词与所述第二词均包括第一字,当所述第一词在所述词为预存词汇的情况下,以第一标识标注所述第一字,且当所述第二词为非预存词汇的情况下,以所述第一标识标注所述第一字。6.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征和所述第二特征,确定所述词的停...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:摩尔线程智能科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1