一种语音识别路径规划方法、系统及平台技术方案

技术编号:28493858 阅读:13 留言:0更新日期:2021-05-19 22:22
本发明专利技术公开了一种语音识别路径规划方法、系统及平台,属于语音信息处理,该方法包括:获取原始语音信息,调用预先训练得到的特征提取模型,提取音频序列特征;基于预测候选集,识别音频序列特征,并得到对应的序列信息表示;调用预先训练得到的语音识别模型,根据序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为路径规划中的下一条路径;调用深度强化网络智能体,完成序列路径决策,得到并输出解析路径信息。通过实施本发明专利技术披露的技术方案能够将语音序列信息的高层表示构建和语音识别的路径构建进行统一训练优化,避免了两者之间差异性造成的影响。响。响。

【技术实现步骤摘要】
一种语音识别路径规划方法、系统及平台


[0001]本专利技术涉语音信息处理,尤其涉及一种语音识别路径规划方法、系统及平台。

技术介绍

[0002]目前,语音识别路径规划的方法,一般是先构建语音的序列表示,然后,基于状态机来构建语音识别的路径。但是,由于两者之间并不是进行统一优化,识别结果会因为两者之间内在建模方式的差异性,而不能达到理想的结果。

技术实现思路

[0003]有鉴于此,本专利技术实施例提出一种语音识别路径规划方法、系统及平台,能够将语音序列信息的高层表示构建和语音识别的路径构建进行统一训练优化,避免了两者之间差异性造成的影响,以至少解决现有技术中存在的以上技术问题。
[0004]根据本专利技术的第一方面,披露一种语音识别路径规划方法,该方法包括:
[0005]获取原始语音信息,调用预先训练得到的特征提取模型,提取音频序列特征;
[0006]基于预测候选集,识别所述音频序列特征,并得到对应的序列信息表示;
[0007]调用预先训练得到的语音识别模型,根据所述序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为所述路径规划中的下一条路径;
[0008]调用深度强化网络智能体,完成序列路径决策,得到并输出解析路径信息。
[0009]根据本专利技术一种可选实施方式,上述语音识别路径规划方法还可包括:
[0010]所述解析路径信息采用可视化方式输出,包括语音输出和/或文字输出;
[0011]所述深度强化网络智能体输出语音的所述解析路径信息时,调用预先训练得到的语言生成模型,将所述语音输出的解析路径信息,识别为文字并输出。
[0012]根据本专利技术一种可选实施方式,上述语音识别路径规划方法还可包括:
[0013]应用随机梯度下降方法,根据预设的间隔时间或实时迭代更新所述深度强化网络智能体的参数信息。
[0014]根据本专利技术一种可选实施方式,上述语音识别路径规划方法中,所述语音识别模型和所述深度强化网络智能体的训练过程包括:
[0015]创建所述语音识别模型和所述深度强化网络智能体,并配置模型参数;
[0016]利用Actor

Critic方法,训练所述语音识别模型和所述深度强化网络智能体,并更新模型参数;
[0017]其中,所述深度强化网络智能体进一步包括:Actor网络智能体和Critic网络智能体;所述Actor网络智能体、所述Critic网络智能体在序列长度维度进行循环,完成序列路径决策,得到语音输出的解析路径。
[0018]根据本专利技术一种可选实施方式,上述语音识别路径规划方法中,所述训练语音识别模型,并更新模型参数,进一步包括:
[0019]所述Actor网络智能体根据当前状态s,从可行的动作集中采样任意一个动作a;所
述Critic网络智能体根据所述Actor网络智能体执行所述动作a和所述当前状态s,对所述动作a进行评估,若选取的动作a与标注路径中的动作不一致,则给予惩罚值,否则给予奖励值;调用预设的状态动作转移模型,所述Actor网络智能体与所述Critic网络智能体在序列长度维度进行循环,获取新的状态s

,并根据所述新的状态s

采样新的动作a


[0020]所述Actor网络智能体的策略参数θ更新为θ+a
θ
Q
w
(s,a)Δ
θ
ln(π
θ
(a|s)),其中,π
θ
(a|s)为所述当前状态s下每个动作的采样概率,Q
w
(s,a)为所述Critic网络智能体对动作和状态对<s,a>的评估值,Δ
θ
ln(π
θ
(a|s))表示ln(π
θ
(a|s))对参数θ进行求导;
[0021]所述Critic网络智能体的参数w更新为w+a
w
δ
t
Δ
w Q
w
(s,a),其中,δ
t
=r
t
+λQ
w
(s

,a

)

Q
w
(s,a),Q
w
(s

,a

)为所述Critic网络智能体对新采样动作和状态对<s

,a

>的评估值。
[0022]根据本专利技术的第二方面,披露一种语音识别路径规划系统,该系统包括:
[0023]数据获取模块,用于获取语音信息;
[0024]特征提取模型,用于提取音频序列特征,并基于预测候选集,识别所述音频序列特征,得到对应的序列信息表示;
[0025]语音识别模型,用于据所述序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为所述路径规划中的下一条路径;
[0026]深度强化网络智能体,用于完成序列路径决策,得到语音输出的解析路径信息;
[0027]预测候选集,配置有文字数据库,包括文字及其位置索引和概率信息;
[0028]实体数据库,配置有标注处理的路径信息。
[0029]根据本专利技术一种可选实施方式,上述语音识别路径规划系统还可包括:
[0030]语言生成模型,用于将所述语音输出的解析路径信息,识别为文字并输出。
[0031]根据本专利技术一种可选实施方式,上述语音识别路径规划系统还可包括:参数更新模块,用于根据随机梯度下降方法,根据预设的间隔时间或实时迭代更新所述深度强化网络智能体的参数信息。
[0032]根据本专利技术一种可选实施方式,上述语音识别路径规划系统还可包括:
[0033]语音控制系统,设置于车机端或智能通信终端,用于发出所述语音信息,接收解析路径信息。
[0034]根据本专利技术一种可选实施方式,上述语音识别路径规划系统还可包括:语音智能助手,用于发出所述语音信息,接收解析路径信息。
[0035]根据本专利技术一种可选实施方式,上述语音识别路径规划系统中,所述深度强化网络智能体进一步包括:Actor网络智能体和Critic网络智能体;所述Actor网络智能体、所述Critic网络智能体在序列长度维度进行循环,完成序列路径决策,得到语音输出的解析路径。
[0036]根据本专利技术的第三方面,披露一种智能化路径规划平台,该平台配置有根据任一种实施方式所述的语音识别路径规划系统。
[0037]与现有技术相比,本专利技术实施例披露的语音识别路径规划方法和系统具有以下有益的技术效果:
[0038]本专利技术披露的基于深度强化学习网络的语音识别路径规划方法,利用深度循环神经网络提取语音的高层语义信息,并利用强化学习网络完成从高层语义信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别路径规划方法,其特征在于,包括:获取原始语音信息,调用预先训练得到的特征提取模型,提取音频序列特征;基于预测候选集,识别所述音频序列特征,并得到对应的序列信息表示;调用预先训练得到的语音识别模型,根据所述序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为所述路径规划中的下一条路径;调用深度强化网络智能体,完成序列路径决策,得到并输出解析路径信息。2.根据权利要求1所述的语音识别路径规划方法,其特征在于,该方法还包括:所述解析路径信息采用可视化方式输出,包括语音输出和/或文字输出;所述深度强化网络智能体输出语音的所述解析路径信息时,调用预先训练得到的语言生成模型,将所述语音输出的解析路径信息,识别为文字并输出。3.根据权利要求1所述的语音识别路径规划方法,其特征在于,该方法还包括:应用随机梯度下降方法,根据预设的间隔时间或实时,迭代更新所述深度强化网络智能体的参数信息。4.根据权利要求1至3任一项所述的语音识别路径规划方法,其特征在于,所述语音识别模型和所述深度强化网络智能体的训练过程包括:创建所述语音识别模型和所述深度强化网络智能体,并配置模型参数;利用Actor

Critic方法,训练所述语音识别模型和所述深度强化网络智能体,并更新模型参数;其中,所述深度强化网络智能体进一步包括:Actor网络智能体和Critic网络智能体;所述Actor网络智能体、所述Critic网络智能体在序列长度维度进行循环,完成序列路径决策,得到语音输出的解析路径。5.根据权利要求4所述的语音识别路径规划方法,其特征在于,所述更新模型参数,进一步包括:所述Actor网络智能体根据当前状态s,从可行的动作集中采样任意一个动作a;所述Critic网络智能体根据所述Actor网络智能体执行所述动作a和所述当前状态s,对所述动作a进行评估,若选取的动作a与标注路径中的动作不一致,则给予惩罚值,否则给予奖励值;调用预设的状态动作转移模型,所述Actor网络智能体与所述Critic网络智能体在序列长度维度进行循环,获取新的状态s

,并根据所述新的状态s

采样新的动作a

;所述Actor网络智能体的策略参数θ更新为θ+a
θ
Q
w
(s,a)Δ
θ
ln(π
θ
(a|s)),其中,π
θ
(a|s)为所述当前状态s下每个动作的采样概率,Q
w
(s,a)为所述C...

【专利技术属性】
技术研发人员:汪剑雷欣李志飞
申请(专利权)人:出门问问武汉信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1