本发明专利技术公开了一种语音识别方法、装置、设备及存储介质,属于语音识别技术领域。本发明专利技术通过提取用户输入的语音信息对应的文本实体;获取所述文本实体对应的实体热度;根据所述文本实体和所述实体热度从所述语音信息中提取出语义意图和语义槽位;根据所述语义意图和所述语义槽位对所述语音信息进行识别,通过文本实体和文本实体对应的实体热度从语音信息提取语义意图和语义槽位,能够准确识别用户语音中的语义。中的语义。中的语义。
【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质
[0001]本专利技术涉及语音识别
,尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
[0002]智能对话系统,可应用在智能音箱、智能机器人、智能车载等业务上,负责人与机器的交互,可实现语音对机器的控制,提高操作的便利性。当前智能对话系统的实现上,通常的做法分成几个步骤:接收用户语音,将语音通过ASR转换成文本,AI对话引擎根据文本语义理解和对话决策生成回复,将AI对话引擎返回的音频回播给用户,这就是一轮完整的人机通话过程。文本语义理解通常有两种做法:第一种是先识别意图,再提取槽位,两个模型实现;第二种是意图识别、槽位提取在一个联合模型中同时实现。以上两种方法在某些场景下效果较差,无法对用户语音中的语义进行准确识别。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
[0004]本专利技术的主要目的在于提供一种语音识别方法、装置、设备及存储介质,旨在解决现有技术无法对用户语音中的语义进行准确识别的技术问题。
[0005]为实现上述目的,本专利技术提供了一种语音识别方法,所述语音识别方法包括以下步骤:
[0006]提取用户输入的语音信息对应的文本实体;
[0007]获取所述文本实体对应的实体热度;
[0008]根据所述文本实体和所述实体热度从所述语音信息中提取出语义意图和语义槽位;
[0009]根据所述语义意图和所述语义槽位对所述语音信息进行识别。<br/>[0010]可选地,所述提取用户输入的语音信息对应的文本实体,包括:
[0011]将用户输入的语音信息转换为语音文本;
[0012]按照预设格式依次为语音文本中的各个字符设置相应的标签;
[0013]根据所述标签对所述语音文本进行词组分类,以获得文本实体。
[0014]可选地,所述获取所述文本实体对应的实体热度,包括:
[0015]获取所述文本实体对应的领域信息;
[0016]根据所述领域信息获取所述文本实体关联的知识信息;
[0017]根据所述知识信息确定所述文本实体对应的实体热度。
[0018]可选地,所述根据所述文本实体和所述实体热度从所述语音信息中提取出语义意图和语义槽位,包括:
[0019]根据所述文本实体确定所述语音信息的语义槽位;
[0020]获取所述语义槽位的槽位信息;
[0021]根据所述槽位信息和所述实体热度确定所述语音信息的语义意图。
[0022]可选地,所述根据所述文本实体确定所述语音信息的语义槽位,包括:
[0023]识别文本实体对应的实体类别;
[0024]根据所述实体类别确定语音信息的语义槽位。
[0025]可选地,所述根据所述槽位信息和所述实体热度确定所述语音信息的语义意图,包括:
[0026]根据所述槽位信息确定领域信息;
[0027]基于预设分类表确定所述领域信息对应的多个参考语义意图;
[0028]基于所述实体热度从多个所述参考语义意图中筛选出所述语音信息的语义意图。
[0029]可选地,所述基于所述实体热度从多个所述参考语义意图中筛选出所述语音信息的语义意图,包括:
[0030]基于所述实体热度确定各个参考语义意图对应的意图优先级;
[0031]根据所述意图优先级确定目标意图优先级;
[0032]将所述目标意图优先级对应的参考语义意图作为所述语音信息的语义意图。
[0033]可选地,所述根据所述语义意图和所述语义槽位对所述语音信息进行识别之后,还包括:
[0034]基于识别结果生成相应的语音回复;
[0035]对所述语音回复进行播放。
[0036]可选地,所述基于识别结果生成相应的语音回复,包括:
[0037]根据所述语义意图和所述语义槽位确定待填充槽位;
[0038]获取所述语音信息关联的知识信息和历史语音信息;
[0039]根据所述知识信息和所述历史语音信息对所述待填充槽位进行填充,以生成语音回复。
[0040]可选地,所述根据所述知识信息和所述历史语音信息对所述待填充槽位进行填充,以生成语音回复,包括:
[0041]根据所述知识信息获取所述待填充槽位对应的多个参考实体;
[0042]根据所述历史语音信息从多个所述参考实体中筛选出目标实体;
[0043]将所述目标实体填充至所述待填充槽位,以生成语音回复。
[0044]可选地,所述根据所述历史语音信息从多个所述参考实体中筛选出目标实体,包括:
[0045]根据所述历史语音信息确定当前对话状态;
[0046]根据所述当前对话状态从多个所述参考实体中筛选出目标实体。
[0047]可选地,所述根据所述语义意图和所述语义槽位对所述语音信息进行识别之后,还包括:
[0048]基于识别结果生成相应的控制指令;
[0049]根据所述控制指令执行相应的操作。
[0050]此外,为实现上述目的,本专利技术还提出一种语音识别装置,所述语音识别装置包括:
[0051]提取模块,用于提取用户输入的语音信息对应的文本实体;
[0052]获取模块,用于获取所述文本实体对应的实体热度;
[0053]所述提取模块,还用于根据所述文本实体和所述实体热度从所述语音信息中提取出语义意图和语义槽位;
[0054]识别模块,用于根据所述语义意图和所述语义槽位对所述语音信息进行识别。
[0055]可选地,所述提取模块,还用于根据所述文本实体确定所述语音信息的语义槽位;获取所述语义槽位的槽位信息;根据所述槽位信息和所述实体热度确定所述语音信息的语义意图。
[0056]可选地,所述提取模块,还用于识别文本实体对应的实体类别;根据所述实体类别确定语音信息的语义槽位。
[0057]可选地,所述提取模块,还用于根据所述槽位信息确定领域信息;基于预设分类表确定所述领域信息对应的多个参考语义意图;基于所述实体热度从多个所述参考语义意图中筛选出所述语音信息的语义意图。
[0058]可选地,所述提取模块,还用于基于所述实体热度确定各个参考语义意图对应的意图优先级;根据所述意图优先级确定目标意图优先级;将所述目标意图优先级对应的参考语义意图作为所述语音信息的语义意图。
[0059]可选地,所述语音识别装置还包括播放模块;
[0060]所述播放模块,用于基于识别结果生成相应的语音回复;对所述语音回复进行播放。
[0061]此外,为实现上述目的,本专利技术还提出一种语音识别设备,所述语音识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音识别程序,所述语音识别程序配置为实现如上文所述的语音识别方法。
[0062]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有语音识别程序,所本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括:提取用户输入的语音信息对应的文本实体;获取所述文本实体对应的实体热度;根据所述文本实体和所述实体热度从所述语音信息中提取出语义意图和语义槽位;根据所述语义意图和所述语义槽位对所述语音信息进行识别。2.如权利要求1所述的语音识别方法,其特征在于,所述提取用户输入的语音信息对应的文本实体,包括:将用户输入的语音信息转换为语音文本;按照预设格式依次为语音文本中的各个字符设置相应的标签;根据所述标签对所述语音文本进行词组分类,以获得文本实体。3.如权利要求1所述的语音识别方法,其特征在于,所述获取所述文本实体对应的实体热度,包括:获取所述文本实体对应的领域信息;根据所述领域信息获取所述文本实体关联的知识信息;根据所述知识信息确定所述文本实体对应的实体热度。4.如权利要求1所述的语音识别方法,其特征在于,所述根据所述文本实体和所述实体热度从所述语音信息中提取出语义意图和语义槽位,包括:根据所述文本实体确定所述语音信息的语义槽位;获取所述语义槽位的槽位信息;根据所述槽位信息和所述实体热度确定所述语音信息的语义意图。5.如权利要求4所述的语音识别方法,其特征在于,所述根据所述文本实体确定所述语音信息的语义槽位,包括:识别文本实体对应的实体类别;根据所述实体类别确定语音信息的语义槽位...
【专利技术属性】
技术研发人员:翟存启,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。