语音识别的方法、装置、电子设备和介质制造方法及图纸

技术编号：35600457 阅读：28 留言：0更新日期：2022-11-16 15:21

本公开的实施例涉及语音识别的方法、装置、电子设备和介质。该方法包括获取流式语音的声学表示和流式语音的已识别部分的语义表示。该方法还包括获取流式语音的对话上下文。该方法还包括基于声学表示、流式语音的已识别部分的语义表示和对话上下文，生成流式语音的识别结果。通过本公开的实施例能够使得语音识别的准确度更高。别的准确度更高。别的准确度更高。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别的方法、装置、电子设备和介质

[0001]本公开的实施例涉及计算机领域，并且更具体地，涉及语音识别的方法、装置、电子设备和介质。

技术介绍

[0002]语音识别是指对说出的语音进行识别，并将其转换成对应文字的技术。随着自然语言处理技术的发展，已经具有对以流式传输方式接收的语音进行识别的技术。在以流式传输方式接收的语音中，语音识别模型无法感知到用户在下文所说的内容，只能知道当前语句的历史信息，因此识别的难度较大，导致识别率较差。

技术实现思路

[0003]本公开的实施例提供了一种语音识别的方法、装置、电子设备和计算机可读存储介质。
[0004]根据本公开的第一方面，提供了一种语音识别的方法。该方法包括获取流式语音的声学表示和流式语音的已识别部分的语义表示。该方法还包括获取流式语音的对话上下文。该方法还包括基于声学表示、流式语音的已识别部分的语义表示和对话上下文，生成流式语音的识别结果。
[0005]在本公开的第二方面中，提供了一种语音识别的装置。该装置包括语音获取模块，被配置为获取流式语音的声学表示和流式语音的已识别部分的语义表示。该装置还包括上下文获取模块，被配置为获取流式语音的对话上下文。该装置还包括识别结果生成模块，被配置为基于声学表示、流式语音的已识别部分的语义表示和对话上下文，生成流式语音的识别结果。
[0006]根据本公开的第三方面，提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器，存储器具有存储于其中的指令，指令在被处理器执行时使电子设备执行...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，包括：获取流式语音的声学表示和所述流式语音的已识别部分的语义表示；获取所述流式语音的对话上下文；以及基于所述声学表示、所述流式语音的所述已识别部分的所述语义表示和所述对话上下文，生成所述流式语音的识别结果。2.根据权利要求1所述的方法，其中获取所述流式语音的对话上下文包括：将所述声学表示和所述语义表示中的至少一项确定为查询向量；确定与所述对话上下文的语义相关联的键值对；以及基于所述查询向量与所述键值对中的键的语义相关性来确定所述对话上下文相对于所述流式语音的语义关联表示。3.根据权利要求2所述的方法，其中基于所述声学表示、所述语义表示和所述对话上下文，生成所述流式语音的识别结果包括：将所述语义关联表示与所述语义表示进行混合以获得混合后的语义表示；以及基于所述声学表示和所述混合后的语义表示，生成所述流式语音的所述识别结果。4.根据权利要求3所述的方法，其中基于所述声学表示和所述混合后的语义表示，生成所述流式语音的所述识别结果包括：基于所述声学表示和所述混合后的语义表示，确定多个候选识别结果的相应概率；以及将所述多个候选识别结果中的概率最大的候选识别结果确定为所述识别结果。5.根据权利要求4所述的方法，其中所述识别结果和所述候选识别结果是文本，并且基于所述声学表示和所述混合后的语义表示，确定多个候选结果的相应概率包括：基于所述声学表示、所述混合后的语义表示以及用于语音识别的字典，确定所述文本的概率表示；以及对所述概率表示进行归一化以获取所述文本的相应概率。6.根据权利要求2所述的方法，其中基于所述声学表示、所述语义表示和所述对话上下文，生成所述流式语音的识别结果包括：将所述语义关联表示与所述声学表示进行混合以获得混合后的声学表示；以及基于所述语义表示和所述混合后的声学表示，生成所述流式语音的所述识别结果。7.根据权利要求6所述的方法，其中基于所述语义表示和所述混合后的声学表示，生成所述流式语音的所述识别结果包括：基于所述语义表示和所述混合后的声学表示，确定多个候选识别结果的相应概率；以及...

【专利技术属性】
技术研发人员：陈金坤，侯俊峰，李婉瑜，张骏，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人