语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：28790872 阅读：29 留言：0更新日期：2021-06-09 11:27

本申请提供一种语音识别方法、装置、设备及存储介质，其中，语音识别方法包括：获取输入语音；基于声学模型和第一语言模型对所述输入语音进行解码，得到所述输入语音的第一识别文本；对所述输入语音的第一识别文本进行话术分类，以标记出所述输入语音的第一识别文本的类别标签；根据所述第一识别文本的类别标签选择第二语言模型，所述第二语言模型根据所述第一识别文本的类别标签对应的训练样本得到；根据所述语言模型对所述输入语音重新对所述输入语音进行解码，以得到所述输入语音的第二识别文本。本申请能够在提供重点领域的语音识别精确度的同时，不降低非重点语音的识别精度，且本申请具有易于更新的优点。本申请具有易于更新的优点。本申请具有易于更新的优点。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质

[0001]本申请涉及语音识别领域，具体而言，涉及一种语音识别方法、装置、设备及存储介质。

技术介绍

[0002]车载语音助手发展在近几年越来越受到大众的关注。场景为用户在开车途中，能借助一个车内助手方便的完成驾驶员一些指令，又能免于驾驶员触摸屏幕做点击动作，如此安全又方便的方式，为驾车人带来愉悦舒适的体验。车内语音助手与用户交互的方式，首先是接受用户发出的语音，将其经过语音识别系统识别为文字后，再对文本做自然语言处理，给出车机反馈。目前，车机助手通常包含的功能有：车控部分，例如打开车窗、调节空调温度等；媒体部分，例如播放某歌曲，播放某广播电台；导航部分，例如导航去某地，导航走躲避拥堵路线等；通话部分，例如给某人打电话，接听某人的电话等。如上应用是驾车人在开车场景中常常出现的几种需求，借助车内语音助手，可以在驾驶员免于低头查找及点击屏幕的情况下，仅靠语音发出指令，由车机助手完成指令动作，这对于驾车人的驾车安全性，驾车愉悦度方面都是质的提升。
[0003]在如上四种应用场景中，尤为后三种场景接受到的语音指令比较复杂。媒体播放领域，包含的歌名，歌手名名目繁多，且更新较快；导航领域，包含的店铺名，道路名也极其繁多。通话领域，包含的人名也会名目繁多又有变化。
[0004]常规的语音识别系统，包含一个声学模型和一个语言模型。其中语言模型由大量文本训练生成。在语音识别过程中，此处称之为解码过程中，对输入的语音，先经过声学模型和三阶的语言模型，给出解码的识别文本结果，此处得到多个...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：获取输入语音；基于声学模型和第一语言模型对所述输入语音进行解码，得到所述输入语音的第一识别文本；对所述输入语音的第一识别文本进行话术分类，以标记出所述输入语音的第一识别文本的类别标签；根据所述第一识别文本的类别标签选择第二语言模型，所述第二语言模型根据所述第一识别文本的类别标签对应的训练样本得到；根据所述第二语言模型对所述输入语音进行解码，以得到所述输入语音的第二识别文本。2.如权利要求1所述的方法，其特征在于，所述基于声学模型和第一语言模型对所述输入语音进行解码，得到所述输入语音的第一识别文本，包括：获取发音词典和词表中的音素列表；根据所述发音词典、所述词表中的音素列表、所述声学模型和所述第一语言模型生成解码网络；将所述输入语音作为所述解码网络的输入，以使得所述解码网络对所述输入语音进行解码并输出所述输入语音的最优路径，所述输入语音的最优路径由若干个词语组成；将所述输入语音的最优路径作为所述输入语音的第一识别文本。3.如权利要求1所述的方法，其特征在于，所述对所述输入语音的第一识别文本进行话术分类，以标记出所述输入语音的第一识别文本的类别标签，包括：将所述输入语音的第一识别文本作为预先训练得到的话术分类模型的输入，使得所述话术分类模型输出所述第一识别文本的若干种标签概率；根据所述若干种标签概率将概率最高的标签作为所述输入语音的第一识别文本的类别标签。4.如权利要求3所述的方法，其特征在于，在所述将所述输入语音的第一识别文本作为预先训练得到的话术分类模型的输入，使得所述话术分类模型输出所述第一识别文本的若干种标签概率之前，所述方法还包括：获取训练集，所述训练集包括若干训练文本；根据训练算法训练所述训练集中的所述若干训练文本，并得到所述话术分类模型，所述训练算法为深度学习算法。5.如权利要求1所述的方法，其特征在于...

【专利技术属性】
技术研发人员：李洁琼，邵鹏，应臻奕，李国庆，
申请(专利权)人：上海仙豆智能机器人有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人