【技术实现步骤摘要】
一种语音识别路径规划方法、系统及平台
[0001]本专利技术涉语音信息处理,尤其涉及一种语音识别路径规划方法、系统及平台。
技术介绍
[0002]目前,语音识别路径规划的方法,一般是先构建语音的序列表示,然后,基于状态机来构建语音识别的路径。但是,由于两者之间并不是进行统一优化,识别结果会因为两者之间内在建模方式的差异性,而不能达到理想的结果。
技术实现思路
[0003]有鉴于此,本专利技术实施例提出一种语音识别路径规划方法、系统及平台,能够将语音序列信息的高层表示构建和语音识别的路径构建进行统一训练优化,避免了两者之间差异性造成的影响,以至少解决现有技术中存在的以上技术问题。
[0004]根据本专利技术的第一方面,披露一种语音识别路径规划方法,该方法包括:
[0005]获取原始语音信息,调用预先训练得到的特征提取模型,提取音频序列特征;
[0006]基于预测候选集,识别所述音频序列特征,并得到对应的序列信息表示;
[0007]调用预先训练得到的语音识别模型,根据所述序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为所述路径规划中的下一条路径;
[0008]调用深度强化网络智能体,完成序列路径决策,得到并输出解析路径信息。
[0009]根据本专利技术一种可选实施方式,上述语音识别路径规划方法还可包括:
[0010]所述解析路径信息采用可视化方式输出,包括语音输出和/或文字输出;
[0011]所述深度强化网络智能 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别路径规划方法,其特征在于,包括:获取原始语音信息,调用预先训练得到的特征提取模型,提取音频序列特征;基于预测候选集,识别所述音频序列特征,并得到对应的序列信息表示;调用预先训练得到的语音识别模型,根据所述序列信息表示,结合当前对应的状态信息,选取当前位置出发收益期望值最高的路径作为所述路径规划中的下一条路径;调用深度强化网络智能体,完成序列路径决策,得到并输出解析路径信息。2.根据权利要求1所述的语音识别路径规划方法,其特征在于,该方法还包括:所述解析路径信息采用可视化方式输出,包括语音输出和/或文字输出;所述深度强化网络智能体输出语音的所述解析路径信息时,调用预先训练得到的语言生成模型,将所述语音输出的解析路径信息,识别为文字并输出。3.根据权利要求1所述的语音识别路径规划方法,其特征在于,该方法还包括:应用随机梯度下降方法,根据预设的间隔时间或实时,迭代更新所述深度强化网络智能体的参数信息。4.根据权利要求1至3任一项所述的语音识别路径规划方法,其特征在于,所述语音识别模型和所述深度强化网络智能体的训练过程包括:创建所述语音识别模型和所述深度强化网络智能体,并配置模型参数;利用Actor
‑
Critic方法,训练所述语音识别模型和所述深度强化网络智能体,并更新模型参数;其中,所述深度强化网络智能体进一步包括:Actor网络智能体和Critic网络智能体;所述Actor网络智能体、所述Critic网络智能体在序列长度维度进行循环,完成序列路径决策,得到语音输出的解析路径。5.根据权利要求4所述的语音识别路径规划方法,其特征在于,所述更新模型参数,进一步包括:所述Actor网络智能体根据当前状态s,从可行的动作集中采样任意一个动作a;所述Critic网络智能体根据所述Actor网络智能体执行所述动作a和所述当前状态s,对所述动作a进行评估,若选取的动作a与标注路径中的动作不一致,则给予惩罚值,否则给予奖励值;调用预设的状态动作转移模型,所述Actor网络智能体与所述Critic网络智能体在序列长度维度进行循环,获取新的状态s
′
,并根据所述新的状态s
′
采样新的动作a
′
;所述Actor网络智能体的策略参数θ更新为θ+a
θ
Q
w
(s,a)Δ
θ
ln(π
θ
(a|s)),其中,π
θ
(a|s)为所述当前状态s下每个动作的采样概率,Q
w
(s,a)为所述C...
【专利技术属性】
技术研发人员:汪剑,雷欣,李志飞,
申请(专利权)人:出门问问武汉信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。