一种风格语料获取方法及相关方法和设备技术

技术编号:32920345 阅读:21 留言:0更新日期:2022-04-07 12:11
本申请提供了一种风格语料获取方法及相关方法和设备,其中,风格语料获取方法可实现风格语料的自动获取,且该风格语料获取方法可获取到质量较佳的风格语料,在本申请提供的风格语料获取方法的基础上,本申请还提供了一种风格迁移模型构建方法,该风格迁移模型构建方法可基于本申请提供的风格语料获取方法获取的风格语料集构建风格迁移模型,在本申请提供的风格迁移模型构建方法的基础上,本申请还提供了一种风格迁移方法,该风格迁移方法可将待处理文本输入利用本申请提供的风格迁移模型构建方法构建的风格迁移模型进行处理,从而得到风格迁移模型输出的风格文本。到风格迁移模型输出的风格文本。到风格迁移模型输出的风格文本。

【技术实现步骤摘要】
一种风格语料获取方法及相关方法和设备


[0001]本申请涉及自然语言处理
,尤其涉及一种风格语料获取方法及相关方法和设备。

技术介绍

[0002]在某些应用场景中,为了提升用户体验,需要将无风格的文本处理为风格文本。
[0003]比如,在智能对话场景中,对话系统需要根据目标发音人的说话内容生成相应的回复文本,进而由语音合成模块合成回复文本对应的语音,然而,对话系统生成的文本为无风格文本(不具有目标发音人的语言风格),这导致后续合成的语音不具有目标发音人的语言风格,用户体验不佳。
[0004]为了将无风格的文本处理为风格文本,目前的研究思路是,获取风格语料,利用风格语料训练能够将无风格的文本处理为风格文本的模型,进而利用训练得到的模型将待处理文本处理为风格文本。然而,风格语料难以获取,这导致上述的思路难以落地实施。

技术实现思路

[0005]有鉴于此,本申请提供了一种风格语料获取方法及相关方法和设备,用以解决风格语料难以获取的问题,其技术方案如下:
[0006]一种风格语料获取方法,包括:
[0007]获取目标发音人的声纹特征,以及预先构建的音频库中各条音频分别对应的声纹特征;
[0008]确定所述目标发音人的声纹特征与每条音频对应的声纹特征的相似度,并根据确定出的相似度,从所述各条音频分别对应的文本中筛选候选风格语料,以得到若干候选风格语料;
[0009]确定所述若干候选风格语料分别对应的风格置信度,并根据确定出的风格置信度,从所述若干候选风格语料中筛选出风格语料,以得到由筛选出的风格语料组成的风格语料集。
[0010]可选的,所述根据确定出的相似度,从所述各条音频分别对应的文本中筛选候选风格语料,包括:
[0011]针对每条音频,若所述目标发音人的声纹特征与该条音频对应的声纹特征的相似度大于预设的声纹相似度阈值,则将该条音频对应的文本确定为候选风格语料;
[0012]所述根据确定出的风格置信度,从所述若干候选风格语料中筛选出风格语料,包括:
[0013]针对每条候选风格语料,若该候选风格语料对应的风格置信度大于预设的风格置信度阈值,则将该候选风格语料确定为风格语料。
[0014]可选的,所述确定所述若干候选风格语料分别对应的风格置信度,包括:
[0015]针对每条候选风格语料,利用风格分类模块,预测该条候选风格语料为风格语料
的概率,作为该条候选风格语料对应的风格置信度。
[0016]可选的,风格分类模块为风格分类模型,所述风格分类模型采用标注有风格类型的正样本和标注有风格类型的负样本训练得到,所述正样本为所述候选风格语料,所述负样本为从预先构建的文本库中随机采样的文本。
[0017]一种风格迁移模型构建方法,包括:
[0018]获取风格语料集,所述风格语料集采用上述任一项所述的风格语料获取方法获得;
[0019]基于所述风格语料集,构建风格迁移模型,其中,所述风格迁移模型用于对输入文本进行处理,输出风格文本。
[0020]可选的,所述风格迁移模型用于对输入的无风格文本进行处理,输出与所述无风格文本具有相同语义的风格文本;
[0021]所述基于所述风格语料集构建风格迁移模型,包括:
[0022]针对所述风格语料集中的每条风格语料,将该条风格语料处理成无风格语料,由该条风格语料和对该条风格语料处理得到的无风格语料组成平行语料对;利用获得的若干平行语料对对风格迁移模型进行训练;
[0023]或者,
[0024]从文本库中随机采样若干条文本,组成文本集,作为无风格语料集;利用所述风格语料集和所述无风格语料集,对风格迁移模型进行训练。
[0025]可选的,所述将该条风格语料处理成无风格语料,包括:
[0026]将该条风格语料中的风格词替换为无风格词,其中,所述风格词为在风格语料中的出现频率高于在无风格语料中出现频率的词;
[0027]或者,将该条风格语料中的风格词删除;
[0028]或者,将该条风格语料翻译为与该风格语料所属语言不同的语言,将翻译结果再翻译回该条风格语料所属语言。
[0029]可选的,所述风格迁移模型为带风格的问答模型,用于对输入的问题文本进行处理,输出所述问题文本对应的风格答案文本;
[0030]所述基于所述风格语料集构建风格迁移模型,包括:
[0031]利用问答语料集中的问答语料和所述风格语料集中的风格语料,对风格迁移模型进行训练。
[0032]可选的,所述风格迁移模型构建方法还包括:
[0033]在风格迁移模型的训练过程中,基于预先构建的风格分类模块,对风格迁移模型的风格迁移效果进行评估;
[0034]其中,所述风格分类模块针对输入文本,能够预测出该输入文本为风格文本的概率。
[0035]一种风格迁移方法,包括:
[0036]获取待处理文本;
[0037]将所述待处理文本输入采用上述任一项所述的风格迁移模型进行处理,得到所述风格迁移模型输出的风格文本。
[0038]可选的,所述风格迁移模型为能够对输入的无风格文本进行处理,输出与所述无
风格文本具有相同语义的风格文本的模型,所述待处理文本为对话系统所基于的问答语料库包含的问答语料中的无风格答案文本,或者为所述对话系统生成的无风格回复文本。
[0039]可选的,所述风格迁移模型为能够对输入的问题文本进行处理,输出所述问题文本对应的风格答案文本的模型,所述待处理文本为对话系统所基于的问答语料库包含的问答语料中的问题文本,或者为对话系统中输入的问题文本。
[0040]一种风格语料获取装置,包括:声纹特征获取模块、声纹相似度确定模块、候选风格语料筛选模块、风格置信度确定模块和风格语料筛选模块;
[0041]所述声纹特征获取模块,用于获取目标发音人的声纹特征,以及预先构建的音频库中各条音频分别对应的声纹特征;
[0042]所述声纹相似度确定模块,用于确定所述目标发音人的声纹特征与每条音频对应的声纹特征的相似度;
[0043]所述候选风格语料筛选模块,用于根据所述声纹相似度确定模块确定出的相似度,从所述各条音频分别对应的文本中筛选候选风格语料,以得到若干候选风格语料;
[0044]所述风格置信度确定模块,用于确定所述若干候选风格语料分别对应的风格置信度;
[0045]所述风格语料筛选模块,用于根据所述风格置信度确定模块确定出的风格置信度,从所述若干候选风格语料中筛选出风格语料,以得到由筛选出的风格语料组成的风格语料集。
[0046]一种风格迁移模型构建装置,包括:风格语料集获取模块和风格迁移模型构建模块;
[0047]所述风格语料集获取模块,用于获取风格语料集,所述风格语料集采用上述任一项所述的风格语料获取方法获得;
[0048]所述风格迁移模型构建模块,用于基于所述风格语料集,构建风格迁移模型,其中,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风格语料获取方法,其特征在于,包括:获取目标发音人的声纹特征,以及预先构建的音频库中各条音频分别对应的声纹特征;确定所述目标发音人的声纹特征与每条音频对应的声纹特征的相似度,并根据确定出的相似度,从所述各条音频分别对应的文本中筛选候选风格语料,以得到若干候选风格语料;确定所述若干候选风格语料分别对应的风格置信度,并根据确定出的风格置信度,从所述若干候选风格语料中筛选出风格语料,以得到由筛选出的风格语料组成的风格语料集。2.根据权利要求1所述的风格语料获取方法,其特征在于,所述根据确定出的相似度,从所述各条音频分别对应的文本中筛选候选风格语料,包括:针对每条音频,若所述目标发音人的声纹特征与该条音频对应的声纹特征的相似度大于预设的声纹相似度阈值,则将该条音频对应的文本确定为候选风格语料;所述根据确定出的风格置信度,从所述若干候选风格语料中筛选出风格语料,包括:针对每条候选风格语料,若该候选风格语料对应的风格置信度大于预设的风格置信度阈值,则将该候选风格语料确定为风格语料。3.根据权利要求1所述的风格语料获取方法,其特征在于,所述确定所述若干候选风格语料分别对应的风格置信度,包括:针对每条候选风格语料,利用风格分类模块,预测该条候选风格语料为风格语料的概率,作为该条候选风格语料对应的风格置信度。4.一种风格迁移模型构建方法,其特征在于,包括:获取风格语料集,所述风格语料集采用如权利要求1~3中任一项所述的风格语料获取方法获得;基于所述风格语料集构建风格迁移模型,其中,所述风格迁移模型用于对输入文本进行处理,输出风格文本。5.根据权利要求4所述的风格迁移模型构建方法,其特征在于,所述风格迁移模型用于对输入的无风格文本进行处理,输出与所述无风格文本具有相同语义的风格文本;所述基于所述风格语料集构建风格迁移模型,包括:针对所述风格语料集中的每条风格语料,将该条风格语料处理成无风格语料,由该条风格语料和对该条风格语料处理得到的无风格语料组成平行语料对;利用获得的若干平行语料对对风格迁移模型进行训练;或者,从文本库中随机采样若干条文本,组成文本集,作为无风格语料集;利用所述风格语料集和所述无风格语料集,对风格迁移模型进行训练。6.根据权利要求5所述的风格迁移模型构建方法,其特征在于,其特征在于,所述将该条风格语料处理成无风格语料,包括:将该条风格语料中的风格词替换为无风格词,其中,所述风格词为在风格语料中的出现频率高于在无风格语料中出现频率的词;或者,将该条风格语料中的风格词删除;
或者,将该条风格语料翻译为与该风格语料所属语言不同的语言,将翻译结果再翻译回该条风格语料所属语言。7.根据权利要求4所述的风格迁移模型构建方法,其特征在于,所述风格迁移模型为带风格的问答模型,用于对输入的问题文本进行处理,输出所述问题文本对应的风格答案文本;所述基于所述风格语料集构建风格迁移模型,包括:利用问答语料集中的问答语料和所述风格语料集中的风格语料,对风格迁移模型进行训练。8.根据权利要求5或7所述的风格迁移模型构建方法,其特征在于,还包括:在风格迁移模型的训练过程中,基于风格分类模块,对风格迁...

【专利技术属性】
技术研发人员:刘洋王栋张伟男王士进刘权陈志刚胡国平刘挺
申请(专利权)人:河北省讯飞人工智能研究院科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1