一种交互语音情感控制方法及系统技术方案

技术编号:39733044 阅读:28 留言:0更新日期:2023-12-17 23:35
本发明专利技术公开了一种交互语音情感控制方法及系统,通过对用户语音进行识别,得到用户语音的情感信息和文本信息,依据文本信息,生成初始交互语音,基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,依据情感倾向,生成语调语音,将初始交互语音和语调语音进行合成,得到最终的交互语音,能够根据不同的情境和语境生成相应的交互语音,从而让交互语音表达出更为丰富的情感,提高用户的交互体验

【技术实现步骤摘要】
一种交互语音情感控制方法及系统


[0001]本专利技术涉及交互语音控制
,尤其涉及一种交互语音情感控制方法及系统


技术介绍

[0002]随着科技的发展,语音交互技术广泛应用在智能机器人

智能音箱

智能车载

智能电器等多种智能语音设备中,智能语音设备可以根据用户发出的交互语音,执行相应的操作,例如回答用户交互语音中的问题,启动或停止设备等,然而,现有的交互语音无法完全模拟真实世界的自然情感表达,可能导致生成的语音有些生硬或不自然,使得用户的交互体验感大大降低


技术实现思路

[0003]有鉴于此,本专利技术提出一种交互语音情感控制方法及系统,可以解决现有技术所存在的生成的语音有些生硬或不自然的缺陷

[0004]本专利技术的技术方案是这样实现的:
[0005]一种交互语音情感控制方法,具体包括:
[0006]获取用户语音;
[0007]对用户语音进行识别,得到用户语音的情感信息和文本信息;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种交互语音情感控制方法,其特征在于,具体包括:获取用户语音;对用户语音进行识别,得到用户语音的情感信息和文本信息;依据文本信息,生成初始交互语音;基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向;依据情感倾向,生成语调语音;将初始交互语音和语调语音进行合成,得到最终的交互语音
。2.
根据权利要求1所述的一种交互语音情感控制方法,其特征在于,所述对用户语音进行识别,得到用户语音的情感信息和文本信息,具体包括:对用户语音进行特征提取,得到用户语音的特征矢量;将用户语音的特征矢量输入预设的语音识别模型中,得到相似度最高的特征矢量;将相似度最高的特征矢量进行线性变换逆变换,得到用户语音的文本信息;对用户语音的文本信息进行关键词提取,得到用户语音的情感信息
。3.
根据权利要求2所述的一种交互语音情感控制方法,其特征在于,所述基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,具体包括:构建情感分析模型;基于所述情感分析模型提取情感信息的特征;依据自然语言处理技术对情感信息的特征进行分析,得到用户的情感倾向
。4.
根据权利要求3所述的一种交互语音情感控制方法,其特征在于,所述构建情感分析模型,具体包括:获取中文情感分析数据集;获取中文预训练模型和分词器;依据分词器对中文情感分析数据集进行预处理,得到训练数据;定义中文预训练模型的优化器

损失函数

评价指标;将训练数据输入定义好的中文预训练模型中进行训练,得到情感分析模型
。5.
根据权利要求4所述的一种交互语音情感控制方法,其特征在于,所述将初始交互语音和语调语音进行合成,得到最终的交互语音,具体包括:构建
vits
语音合成模型;将初始交互语音和语调语音输入所述
vits
语音合成模型进行合成,得到最终的交互语音
。6.
根据权利要求5所述的一种交互语音情感控制方法,其特征在于,所述方法还包括:依据语音评估指标对最终的交互语音进行评估,得到评估结果;依据评估结果对所述
vits
语音合成模型进行参数调节
。7.
一种交互语音情感控制系统,其特征在于,包...

【专利技术属性】
技术研发人员:陈章庄华黎嘉宏李耀坚
申请(专利权)人:广东广信通信服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1