当前位置: 首页 > 专利查询>河北省讯飞人工智能研究院科大讯飞股份有限公司专利>正文

一种风格语料获取方法及相关方法和设备技术

技术编号：32920345 阅读：21 留言：0更新日期：2022-04-07 12:11

本申请提供了一种风格语料获取方法及相关方法和设备，其中，风格语料获取方法可实现风格语料的自动获取，且该风格语料获取方法可获取到质量较佳的风格语料，在本申请提供的风格语料获取方法的基础上，本申请还提供了一种风格迁移模型构建方法，该风格迁移模型构建方法可基于本申请提供的风格语料获取方法获取的风格语料集构建风格迁移模型，在本申请提供的风格迁移模型构建方法的基础上，本申请还提供了一种风格迁移方法，该风格迁移方法可将待处理文本输入利用本申请提供的风格迁移模型构建方法构建的风格迁移模型进行处理，从而得到风格迁移模型输出的风格文本。到风格迁移模型输出的风格文本。到风格迁移模型输出的风格文本。

全部详细技术资料下载

【技术实现步骤摘要】
一种风格语料获取方法及相关方法和设备

[0001]本申请涉及自然语言处理
，尤其涉及一种风格语料获取方法及相关方法和设备。

技术介绍

[0002]在某些应用场景中，为了提升用户体验，需要将无风格的文本处理为风格文本。
[0003]比如，在智能对话场景中，对话系统需要根据目标发音人的说话内容生成相应的回复文本，进而由语音合成模块合成回复文本对应的语音，然而，对话系统生成的文本为无风格文本(不具有目标发音人的语言风格)，这导致后续合成的语音不具有目标发音人的语言风格，用户体验不佳。
[0004]为了将无风格的文本处理为风格文本，目前的研究思路是，获取风格语料，利用风格语料训练能够将无风格的文本处理为风格文本的模型，进而利用训练得到的模型将待处理文本处理为风格文本。然而，风格语料难以获取，这导致上述的思路难以落地实施。

技术实现思路

[0005]有鉴于此，本申请提供了一种风格语料获取方法及相关方法和设备，用以解决风格语料难以获取的问题，其技术方案如下：
[0006]一种风格语料获取方法，包括：
[0007]获取目标发音人的声纹特征，以及预先构建的音频库中各条音频分别对应的声纹特征；
[0008]确定所述目标发音人的声纹特征与每条音频对应的声纹特征的相似度，并根据确定出的相似度，从所述各条音频分别对应的文本中筛选候选风格语料，以得到若干候选风格语料；
[0009]确定所述若干候选风格语料分别对应的风格置信度，并根据确定出的风格置信度，从所述若干候选风格语料...

【技术保护点】

【技术特征摘要】
1.一种风格语料获取方法，其特征在于，包括：获取目标发音人的声纹特征，以及预先构建的音频库中各条音频分别对应的声纹特征；确定所述目标发音人的声纹特征与每条音频对应的声纹特征的相似度，并根据确定出的相似度，从所述各条音频分别对应的文本中筛选候选风格语料，以得到若干候选风格语料；确定所述若干候选风格语料分别对应的风格置信度，并根据确定出的风格置信度，从所述若干候选风格语料中筛选出风格语料，以得到由筛选出的风格语料组成的风格语料集。2.根据权利要求1所述的风格语料获取方法，其特征在于，所述根据确定出的相似度，从所述各条音频分别对应的文本中筛选候选风格语料，包括：针对每条音频，若所述目标发音人的声纹特征与该条音频对应的声纹特征的相似度大于预设的声纹相似度阈值，则将该条音频对应的文本确定为候选风格语料；所述根据确定出的风格置信度，从所述若干候选风格语料中筛选出风格语料，包括：针对每条候选风格语料，若该候选风格语料对应的风格置信度大于预设的风格置信度阈值，则将该候选风格语料确定为风格语料。3.根据权利要求1所述的风格语料获取方法，其特征在于，所述确定所述若干候选风格语料分别对应的风格置信度，包括：针对每条候选风格语料，利用风格分类模块，预测该条候选风格语料为风格语料的概率，作为该条候选风格语料对应的风格置信度。4.一种风格迁移模型构建方法，其特征在于，包括：获取风格语料集，所述风格语料集采用如权利要求1～3中任一项所述的风格语料获取方法获得；基于所述风格语料集构建风格迁移模型，其中，所述风格迁移模型用于对输入文本进行处理，输出风格文本。5.根据权利要求4所述的风格迁移模型构建方法，其特征在于，所述风格迁移模型用于对输入的无风格文本进行处理，输出与所述无风格文本具有相同语义的风格文本；所述基于所述风格语料集构建风格迁移模型，包括：针对所述风格语料集中的每条风格语料，将该条风格语料处理成无风格语料，由该条风格语料和对该条风格语料处理得到的无风格语料组成平行语料对；利用获得的若干平行语料对对风格迁移模型进行训练；或者，从文本库中随机采样若干条文本，组成文本集，作为无风格语料集；利用所述风格语料集和所述无风格语料集，对风格迁移模型进行训练。6.根据权利要求5所述的风格迁移模型构建方法，其特征在于，其特征在于，所述将该条风格语料处理成无风格语料，包括：将该条风格语料中的风格词替换为无风格词，其中，所述风格词为在风格语料中的出现频率高于在无风格语料中出现频率的词；或者，将该条风格语料中的风格词删除；
或者，将该条风格语料翻译为与该风格语料所属语言不同的语言，将翻译结果再翻译回该条风格语料所属语言。7.根据权利要求4所述的风格迁移模型构建方法，其特征在于，所述风格迁移模型为带风格的问答模型，用于对输入的问题文本进行处理，输出所述问题文本对应的风格答案文本；所述基于所述风格语料集构建风格迁移模型，包括：利用问答语料集中的问答语料和所述风格语料集中的风格语料，对风格迁移模型进行训练。8.根据权利要求5或7所述的风格迁移模型构建方法，其特征在于，还包括：在风格迁移模型的训练过程中，基于风格分类模块，对风格迁...

【专利技术属性】
技术研发人员：刘洋，王栋，张伟男，王士进，刘权，陈志刚，胡国平，刘挺，
申请(专利权)人：河北省讯飞人工智能研究院科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人