基于对抗神经网络优化语音控制的方法技术

技术编号:39782224 阅读:6 留言:0更新日期:2023-12-22 02:25
本发明专利技术涉及一种基于对抗神经网络优化语音控制的方法

【技术实现步骤摘要】
基于对抗神经网络优化语音控制的方法、系统及存储介质


[0001]本专利技术涉及语音控制的
,特指一种基于对抗神经网络优化语音控制的方法

系统及存储介质


技术介绍

[0002]现有的语音控制系统通常依赖于自然语言处理
(NLP)
和自然语言理解
(NLU)
技术来解释驾驶员的语音指令,并执行相应的操作

虽然现有技术已经存在一些在线
NLU
解决方案,但它们仍然存在以下限制:
[0003]一

有限的语音指令支持:当前的系统只能识别和执行特定的语音指令,这就限制了用户的交互方式,因为驾驶员必须记住特定的短语或命令,而无法进行更自然的口头交流;
[0004]二

技术限制:现有技术的
NLU
系统虽然能够解析意图,但在处理复杂的人类口语化意图时仍然存在限制

这些系统往往不能准确地理解多义词

上下文或口音变化等因素,导致执行失败或误解;
[0005]三

静态性:目前的智能车载系统通常是静态的,不能适应驾驶员的变化和学习,因此无法不断提高对话的质量和成功率


技术实现思路

[0006]本专利技术的目的在于克服现有技术的缺陷,提供一种基于对抗神经网络优化语音控制的方法

系统及存储介质,解决现有的语音控制系统存在有限的语音质量支持,无法进行更自然的口头交流,因技术限制而不能准确地理解用户意图而导致执行失败或误解以及静态性无法不断地提高成功率等的问题

[0007]实现上述目的的技术方案是:
[0008]本专利技术提供了一种基于对抗神经网络优化语音控制的方法,其特征在于,包括如下步骤:
[0009]收集用户的语音指令数据,包括语音指令和对应的控制行为;
[0010]创建
GAN
模型,所创建的
GAN
模型包括生成器网络和判别器网络,利用所收集的语音指令数据对所创建的
GAN
模型进行模型训练,以使得所述生成器网络能够生成虚拟语音指令,所述判别器网络能够评估所述虚拟语音指令的执行结果;
[0011]利用所述生成器网络生成虚拟语音指令,并将所述虚拟语音指令发送给语音控制系统执行;
[0012]对语音控制系统实际执行虚拟语音指令的结果进行记录;
[0013]针对执行结果不成功的虚拟语音指令,将所述虚拟语音指令存入到语音控制系统中,以实现对语音控制系统的动态扩展

[0014]本专利技术利用对抗神经网络生成虚拟语音指令,以模拟用户实际的语音控制,在语音控制系统无法识别或者识别不准确时,能够将虚拟语音指令存入到语音控制系统中,提
高语音控制系统的成功率,使得系统能够自学习,并且优化对人类口语化意图的识别,用户能够以更自然的方式与语音控制系统进行交流,而无需记住特定的语音指令,本专利技术的方法有助于降低误解和执行失败的风险

[0015]本专利技术基于对抗神经网络优化语音控制的方法的进一步改进在于,还包括:
[0016]定期的收集用户日志,从所收集的用户日志中筛选出语音控制系统未识别的语音指令;
[0017]将所筛选出来未识别的语音指令进行文本转换得到对应的文本指令;
[0018]为所述文本指令赋予对应的行为参数;
[0019]将未识别的语音指令和赋予的行为参数组合形成新的训练数据;
[0020]利用新的训练数据对所述
GAN
模型进行模型训练

[0021]本专利技术基于对抗神经网络优化语音控制的方法的进一步改进在于,对语音控制系统实际执行虚拟语音指令的结果进行记录包括:
[0022]对是否成功执行以及执行速度进行记录

[0023]本专利技术基于对抗神经网络优化语音控制的方法的进一步改进在于,所述生成器网络所生成的虚拟语音指令带有控制行为

[0024]本专利技术基于对抗神经网络优化语音控制的方法的进一步改进在于,对收集的用户的语音指令数据进行预处理

[0025]本专利技术还提供了一种基于对抗神经网络优化语音控制的系统,包括:
[0026]数据收集单元,用于获取用户的语音指令数据,所述语音指令数据包括语音指令和对应的控制行为;
[0027]模型建立单元,与所述数据收集单元连接,用于创建
GAN
模型,所创建的
GAN
模型包括生成器网络和判别器网络,所述模型建立单元还用于利用所述数据收集单元获取的语音指令数据对所创建的
GAN
模型进行模型训练,以使得所述生成器网络能够生成虚拟语音指令,所述判别器网络能够评估所述虚拟语音指令的执行结果;
[0028]指令模拟单元,与所述模型建立单元连接,用于获取所述生成器网络生成的虚拟语音指令,并将所述虚拟语音指令发送给语音控制系统执行;
[0029]动态处理单元,与所述指令模拟单元和所述语音控制系统连接,用于针对执行结果不成功的虚拟语音指令,将所述虚拟语音指令存入到语音控制系统中以对语音控制系统进行动态扩展

[0030]本专利技术基于对抗神经网络优化语音控制的系统的进一步改进在于,所述数据收集单元还定期的获取用户日志中筛选出来的未识别的语音指令及对应的行为参数,形成新的训练数据;
[0031]所述模型建立单元还用于定期的获取新的训练数据一对
GAN
模型进行模型训练

[0032]本专利技术基于对抗神经网络优化语音控制的系统的进一步改进在于,所述动态处理单元还用于对语音控制系统的执行结果进行记录,记录是否成功执行以及执行速度

[0033]本专利技术基于对抗神经网络优化语音控制的系统的进一步改进在于,所述生成器网络所生成的虚拟语音指令中带有控制行为

[0034]本专利技术还提供了一种存储介质,所述存储介质上存储有基于对抗神经网络优化语音控制的方法的程序,所述基于对抗神经网络优化语音控制的方法的程序被处理器执行时
实现所述的基于对抗神经网络优化语音控制的方法的步骤

附图说明
[0035]图1为本专利技术对抗神经网络优化语音控制的方法的流程图

[0036]图2为本专利技术对抗神经网络优化语音控制的系统及方法的技术流程图

[0037]图3为本专利技术对抗神经网络优化语音控制的系统的系统图

具体实施方式
[0038]下面结合附图和具体实施例对本专利技术作进一步说明

[0039]参阅图1,本专利技术提供了一种基于对抗神经网络优化语音控制的方法

系统及存储介质,特别适用于对车辆的智能座舱的语音控制系统进行优化

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于对抗神经网络优化语音控制的方法,其特征在于,包括如下步骤:收集用户的语音指令数据,包括语音指令和对应的控制行为;创建
GAN
模型,所创建的
GAN
模型包括生成器网络和判别器网络,利用所收集的语音指令数据对所创建的
GAN
模型进行模型训练,以使得所述生成器网络能够生成虚拟语音指令,所述判别器网络能够评估所述虚拟语音指令的执行结果;利用所述生成器网络生成虚拟语音指令,并将所述虚拟语音指令发送给语音控制系统执行;对语音控制系统实际执行虚拟语音指令的结果进行记录;针对执行结果不成功的虚拟语音指令,将所述虚拟语音指令存入到语音控制系统中,以实现对语音控制系统的动态扩展
。2.
如权利要求1所述的基于对抗神经网络优化语音控制的方法,其特征在于,还包括:定期的收集用户日志,从所收集的用户日志中筛选出语音控制系统未识别的语音指令;将所筛选出来未识别的语音指令进行文本转换得到对应的文本指令;为所述文本指令赋予对应的行为参数;将未识别的语音指令和赋予的行为参数组合形成新的训练数据;利用新的训练数据对所述
GAN
模型进行模型训练
。3.
如权利要求1所述的基于对抗神经网络优化语音控制的方法,其特征在于,对语音控制系统实际执行虚拟语音指令的结果进行记录包括:对是否成功执行以及执行速度进行记录
。4.
如权利要求1所述的基于对抗神经网络优化语音控制的方法,其特征在于,所述生成器网络所生成的虚拟语音指令带有控制行为
。5.
如权利要求1所述的基于对抗神经网络优化语音控制的方法,其特征在于,对收集的用户的语音指令数据进行预处理
。6.
一种基于对抗神经网络优化语音控制的系统,其特征在于,包括:数据收集单元,用于获...

【专利技术属性】
技术研发人员:张泽宇邱祎陈吉胜
申请(专利权)人:云知声上海智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1