一种语音编辑方法及相关设备技术

技术编号:27305986 阅读:25 留言:0更新日期:2021-02-10 09:18
本发明专利技术公开了一种语音编辑方法,该方法包括:对接收到的第一声音信息进行语音识别,获取所述第一声音信息的声音属性信息和第一文本信息;将所述第一声音属性信息输入已训练的声音转换模型,得到经过声音转换后的第二声音属性信息;对所述第一文本信息进行敏感信息过滤,得到第二文本信息;将所述第二声音属性信息与所述第二文本信息进行语音合成,得到第二声音信息。本发明专利技术所述方法通过对交流双方发出的语音信息进行编辑,调整语音信息中带有情绪的语气和过滤其中含有的敏感信息汇,使得沟通双方可以在非情绪因素的干扰下顺利完成事件处理,提高办事效率,减少事件处理等待时间。此外本发明专利技术还公开了一种语音编辑装置及相关设备。备。备。

【技术实现步骤摘要】
一种语音编辑方法及相关设备


[0001]本专利技术涉及语音交互
,尤其涉及的是一种语音编辑方法及相关设备。

技术介绍

[0002]语音交流现有技术中最为常见的沟通方式,其包括:面对面沟通。电话沟通或者网络语音聊天等,而语音交流双方在进行语音聊天时,可能会出沟通不顺畅的情况,比如:当一方出现情绪失控,发出的语音音量过高或过低,或者发出的语音中含有一个或多个敏感信息,但是由于现有技术中沟通双方发出的语音信息未经过编辑和过滤,便直接发送至对方,因此语音信息中带有情绪的词语和语气可能会导致交流双方发生争执,造成原计划要完成的事件未能顺利处理完成,最终导致办事效率低的缺陷。进一步的,若语音交流为客户与人工客服之间,不仅仅会导致处理事件效率低,用户等待时间久,还会导致客服过程不规范,客户流失严重等问题,给语音交流双方的处理事件带来诸多不便。
[0003]因此,现有技术有待于进一步的改进。

技术实现思路

[0004]鉴于上述现有技术中的不足之处,本专利技术提供了一种语音编辑方法及相关设备,克服现有技术中的语音交流双方发出的语音信息未经过信息识别,其中含有的敏感信息可能会导致交流双方无法顺利事件处理,导致办事效率低的缺陷。
[0005]第一方面,本专利技术实施例提供了一种语音编辑方法,包括:
[0006]接收第一声音信息,对所述第一声音信息进行语音识别,获取所述第一声音信息的声音属性信息和所述第一声音信息所包含的第一文本信息;
[0007]将所述第一声音属性信息输入已训练的声音转换模型,得到经过声音转换后的第二声音属性信息,所述声音转换模型是基于输入声音属性与目标转换声音属性信息之间的对应关系训练而成的;其中,所述目标转换声音属性信息为按照预设声道参数范围对所述输入声音属性信息的声道参数进行调整后的声音属性信息;
[0008]对所述第一文本信息进行敏感信息过滤,得到第二文本信息;
[0009]将所述第二声音属性信息与所述第二文本信息进行语音合成,得到第二声音信息。
[0010]可选的,所述对所述第一声音信息进行语音识别的步骤包括:
[0011]将所述第一声音信息输入至已训练的声音识别模型中,得到所述第一声音属性信息和所述第一文本信息;所述声音识别模型是基于输入声音信息以及与所述声音信息所对应的声音属性信息和声音信息中所包含文本信息之间的对应关系训练而成的。
[0012]可选的,所述声音转换模型包括:语音分析层、参数预测层和信息转换层;
[0013]所述将所述第一声音属性信息输入已训练的声音转换模型,得到经过声音转换后的第二声音属性信息的步骤包括:
[0014]将所述第一声音属性信息输入语音分析层,得到所述语音分析层输出所述第一声
音属性信息所对应的声道参数;
[0015]将所述第一声音属性信息所对应的声道参数输入到参数预测层,得到所述参数预测层按照预设声道参数范围对所述第一声音属性信息进行调整后,输出调整后的声道参数;
[0016]将所述调整后的声道参数输入到信息转换层,得到所述信息转换层输出的所述第二声道属性信息。
[0017]可选的,所述将所述第一声音属性信息所对应的声道参数输入到参数预测层,得到所述参数预测层按照预设声道参数范围对所述第一声音属性信息进行调整后,输出调整后的声道参数的步骤包括:
[0018]所述参数预测层接收所述声道参数,提取所述声道参数中含有的性别标识;
[0019]以及,将所述性别标识与预存接听方性别标识进行比对,若性别标识相同,则在所述预设声道参数范围内对所述第一声音属性信息的所属性别进行调整,输出调整后的声道参数,所述调整后的声道参数为所述第一声音属性信息的所属性别更改后的声道参数。
[0020]可选的,所述将所述第一声音属性信息所对应的声道参数输入到参数预测层,得到所述参数预测层按照预设声道参数范围对所述第一声音属性信息进行调整后,输出调整后的声道参数的步骤包括:
[0021]所述参数预测层接收所述声道参数,提取所述声道参数中含有的韵律参数和音频参数,并将所述韵律参数和音频参数调整到所述预设声道参数范围内,输出调整后的声道参数。
[0022]可选的,所述对所述第一文本信息进行敏感信息过滤的步骤包括:
[0023]将所述第一文本信息输入至已训练的信息过滤模型,得到过滤后的第二文本信息,所述信息过滤模型是基于文本信息与标记为敏感信息之间的对应关系训练而成的。
[0024]可选的,所述将所述第一文本信息输入至已训练的信息过滤模型,得到过滤后的第二文本信息的步骤之后还包括:
[0025]将所述第二文本信息输入至深度语义模型,得到整合后的第三文本信息;所述深度语义模型是基于文本信息与相匹配信息之间的对应关系训练而成的;所述相匹配信息为与所述文本信语义匹配度超出预设阈值的文本信息;
[0026]将所述第三文本信息作为所述第二文本信息输入至所述语音合成模型中。
[0027]可选的,所述将所述第二声音属性信息与所述第一文本信息进行语音合成的步骤包括:
[0028]将所述第二声音属性信息和所述第二文本信息输入至语音合成模型,得到输出的第二声音信息,所述语音合成模型是基于样本声音属性信息、第二文本信息和样本合成音频之间的对应关系训练而成的,其中,所述样本合成音频为根据所述样本声音属性信息和所述第二文本信息所生成的音频。
[0029]第二方面,本专利技术实施例提供了一种语音编辑装置,包括:
[0030]语音识别模块,用于接收第一声音信息,对所述第一声音信息进行语音识别,获取所述第一声音信息的声音属性信息和所述第一声音信息所包含的第一文本信息;
[0031]属性信息转换模块,用于将所述第一声音属性信息输入已训练的声音转换模型,得到经过声音转换后的第二声音属性信息,所述声音转换模型是基于输入声音属性信息与
目标转换声音属性信息之间的对应关系训练而成的;其中,所述目标转换声音属性信息为按照预设声道参数范围对所述输入声音属性信息的声道参数进行调整后的声音属性信息;
[0032]文本过滤模块,用于对所述第一文本信息进行敏感信息过滤,得到第二文本信息;
[0033]语音合成模块,用于将所述第二声音属性信息与所述第二文本信息进行语音合成,得到第二声音信息。
[0034]第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中,所述处理器执行所述计算机程序时实现所述方法的步骤。
[0035]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述的方法的步骤。
[0036]与现有技术相比,本专利技术实施例具有以下优点:
[0037]根据本专利技术实施方式提供的方法,通过对交流双方发出的声音信息进行编辑,获取所述声音信息的第一声音属性信息和第一文本信息,利用已训练的声音转换模型对所述第一声本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音编辑方法,其特征在于,包括以下步骤:接收第一声音信息,对所述第一声音信息进行语音识别,获取所述第一声音信息的第一声音属性信息和所述第一声音信息所包含的第一文本信息;将所述第一声音属性信息输入已训练的声音转换模型,得到经过声音转换后的第二声音属性信息,所述声音转换模型是基于输入声音属性信息与目标转换声音属性信息之间的对应关系训练而成的;其中,所述目标转换声音属性信息为按照预设声道参数范围对所述输入声音属性信息的声道参数进行调整后的声音属性信息;对所述第一文本信息进行敏感信息过滤,得到第二文本信息;将所述第二声音属性信息与所述第二文本信息进行语音合成,得到第二声音信息。2.根据权利要求1所述的语音编辑方法,其特征在于,所述对所述第一声音信息进行语音识别的步骤包括:将所述第一声音信息输入至已训练的声音识别模型中,得到所述第一声音属性信息和所述第一文本信息;所述声音识别模型是基于输入声音信息以及与所述声音信息所对应的声音属性信息和声音信息中所包含文本信息之间的对应关系训练而成的。3.根据权利要求1或2所述的语音编辑方法,其特征在于,所述声音转换模型包括:语音分析层、参数预测层和信息转换层;所述将所述第一声音属性信息输入已训练的声音转换模型,得到经过声音转换后的第二声音属性信息的步骤包括:将所述第一声音属性信息输入所述语音分析层,得到所述语音分析层输出所述第一声音属性信息所对应的声道参数;将所述第一声音属性信息所对应的声道参数输入到所述参数预测层,得到所述参数预测层按照所述预设声道参数范围对所述第一声音属性信息进行调整后,输出调整后的声道参数;将所述调整后的声道参数输入到所述信息转换层,得到所述信息转换层输出的所述第二声道属性信息。4.根据权利要求3所述的语音编辑方法,其特征在于,所述将所述第一声音属性信息所对应的声道参数输入到参数预测层,得到所述参数预测层按照预设声道参数范围对所述第一声音属性信息进行调整后,输出调整后的声道参数的步骤包括:所述参数预测层接收所述声道参数,提取所述声道参数中含有的性别标识;以及,将所述性别标识与预存接听方性别标识进行比对,若所述性别标识与预存接听方性别标识相同,则在所述预设声道参数范围内对所述第...

【专利技术属性】
技术研发人员:赖国锋
申请(专利权)人:深圳TCL数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1