一种关于音频数据的意图识别方法及装置制造方法及图纸

技术编号:35430306 阅读:18 留言:0更新日期:2022-11-03 11:34
本发明专利技术提供一种关于音频数据的意图识别方法及装置,方法包括:获取包含目标语音的音频数据;将包含目标语音的音频数据输入预先训练的联合模型,得到目标语音的指令意图;其中,联合模型是基于样本音频数据训练得到的,包括语义槽填充层、意图预测层和指令意图获取层;其中,语义槽填充层用于根据包含目标语音的音频数据,获取语义文字向量;意图预测层用于根据包含目标语音的音频数据,获取语义预测向量;指令意图获取层用于根据语义文字向量和语义预测向量,获取联合目标函数,并基于联合目标函数得到目标语音的指令意图。本发明专利技术通过联合模型深层次的理解用户意图,对目标语音的多种意图进行精确高效识别,得到目标语音的指令意图。意图。意图。

【技术实现步骤摘要】
一种关于音频数据的意图识别方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及一种关于音频数据的意图识别方法及装置。

技术介绍

[0002]近些年随着自然语言处理、知识图谱等相关技术的发展,问答系统已经扩展到了众多领域。通过与运维机器人进行人机交互,以一问一答的方式轻松完成运维动作,可以大幅度提高运维人员工作效率,而意图识别(Intent Detection)是人机对话系统构成的关键。
[0003]现有的运维机器人更多的是某一独立功能的问答系统,用户在不同的场合下可能会有不同意图,因而会涉及人机对话系统中的多个领域,其中包括任务型垂直领域和闲聊等。任务型垂直领域的意图文本具有主题鲜明,易于检索的特点,比如,查询内存使用率、CPU使用率等。而聊天类意图文本一般具有主题不明确,语义宽泛、语句简短等特点,注重在开放域上与人类进行交流。在对话系统中只有明确了用户的话题领域,才能正确分析用户的具体需求,否则会造成后面意图的错误识别。
[0004]现有的技术是基于规则模板的单意图识别方法,基于规则模板的意图识别方法一般需要人为构建规则模板以及类别信息对用户意图文本进行分类。现有技术针对消费意图识别,基于规则和图的方法来获取意图模板,在单一领域取得了较好的分类效果。后来发现在同一领域下,不同的表达方式会导致规则模板数量的增加,需要耗费大量的人力物力。所以,基于规则模板匹配的方法虽然不需要大量的训练数据,就可以保证识别的准确性,但是却无法解决意图文本更换类别时带来重新构造模板的高成本问题,也就是说,现有技术在意图识别时的缺陷在于:适用于单意图识别的基于规则模版的方法并不适用于多意图识别,现有意图识别技术急需一种适用于多意图识别的方法。

技术实现思路

[0005]本专利技术提供一种关于音频数据的意图识别方法及装置,用以解决现有技术中的意图识别方法不适用多意图识别的问题,通过联合模型深层次的理解用户意图,对目标语音的多种意图进行精确高效识别。
[0006]本专利技术提供一种关于音频数据的意图识别方法,包括:获取包含目标语音的音频数据;将所述包含目标语音的音频数据输入预先训练的联合模型,得到目标语音的指令意图;其中,所述联合模型是基于样本音频数据训练得到的,包括语义槽填充层、意图预测层和指令意图获取层;其中,所述语义槽填充层用于根据所述包含目标语音的音频数据,获取语义文字向量;所述意图预测层用于根据所述包含目标语音的音频数据,获取语义预测向量;
所述指令意图获取层用于根据所述语义文字向量和所述语义预测向量,获取联合目标函数,并基于所述联合目标函数得到目标语音的指令意图。
[0007]根据本专利技术提供的关于音频数据的意图识别方法,所述根据所述包含目标语音的音频数据,获取语义文字向量,包括:将所述包含目标语音的音频数据转化为初始向量;将所述初始向量映射成语义文字向量。
[0008]根据本专利技术提供的关于音频数据的意图识别方法,所述将所述初始向量映射成语义文字向量,包括:基于所述初始向量,求得隐层向量和槽上下文向量;基于所述隐层向量和所述槽上下文向量,通过softmax函数,求得所述语义文字向量。
[0009]根据本专利技术提供的关于音频数据的意图识别方法,所述槽上下文向量包括注意得分参数,所述注意得分参数用于表示音频数据中的单个字词本身对应的多个具体含义中每个具体含义符合单个字词在上下文中实际含义的概率。
[0010]根据本专利技术提供的关于音频数据的意图识别方法,所述根据所述包含目标语音的音频数据,获取语义预测向量,包括:根据所述包含目标语音的音频数据,获取意图上下文向量;基于所述意图上下文向量,获取语义预测向量。
[0011]根据本专利技术提供的关于音频数据的意图识别方法,还包括:基于所述槽上下文向量和所述意图上下文向量,获取加权特征参数;其中,所述加权特征参数用于提高所述语义槽填充层的性能。
[0012]根据本专利技术提供的关于音频数据的意图识别方法,方法还包括:获取样本音频数据,其中,样本音频数据包括非目标用户音频数据和目标用户音频数据;基于所述非目标用户音频数据,对混合高斯

通用背景模型GMM

UBM进行训练,得到先验模型;基于所述目标用户音频数据,对所述先验模型进行训练,得到联合模型。
[0013]本专利技术还提供一种关于音频数据的意图识别装置,包括:音频数据获取模块,用于获取包含目标语音的音频数据;音频数据处理模块,用于将所述包含目标语音的音频数据输入预先训练的联合模型,得到目标语音的指令意图;其中,所述联合模型是基于样本音频数据训练得到的,包括语义槽填充层、意图预测层和指令意图获取层;其中,所述语义槽填充层用于根据所述包含目标语音的音频数据,获取语义文字向量;所述意图预测层用于根据所述包含目标语音的音频数据,获取语义预测向量;所述指令意图获取层用于根据所述语义文字向量和所述语义预测向量,获取联合目标函数,并由所述联合目标函数得到目标语音的指令意图。
[0014]本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如所述关于音频数据的
意图识别方法的步骤。
[0015]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如所述关于音频数据的意图识别方法的步骤。
[0016]本专利技术提供的关于音频数据的意图识别方法及装置,通过获取包含目标语音的音频数据;将所述包含目标语音的音频数据输入预先训练的联合模型,得到目标语音的指令意图;其中,所述联合模型是基于样本音频数据训练得到的,包括语义槽填充层、意图预测层和指令意图获取层;其中,所述语义槽填充层用于根据所述包含目标语音的音频数据,获取语义文字向量;所述意图预测层用于根据所述包含目标语音的音频数据,获取语义预测向量;所述指令意图获取层用于根据所述语义文字向量和所述语义预测向量,获取联合目标函数,并基于所述联合目标函数得到目标语音的指令意图;本专利技术通过联合模型深层次的理解用户意图,对目标语音的多种意图进行精确高效识别,得到目标语音的指令意图,取得了显著的进步。
附图说明
[0017]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本专利技术提供的关于音频数据的意图识别方法的流程示意图;图2是本专利技术提供的关于音频数据的意图识别装置的结构示意图;图3是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0019]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关于音频数据的意图识别方法,其特征在于,包括:获取包含目标语音的音频数据;将所述包含目标语音的音频数据输入预先训练的联合模型,得到目标语音的指令意图;其中,所述联合模型是基于样本音频数据训练得到的,包括语义槽填充层、意图预测层和指令意图获取层;其中,所述语义槽填充层用于根据所述包含目标语音的音频数据,获取语义文字向量;所述意图预测层用于根据所述包含目标语音的音频数据,获取语义预测向量;所述指令意图获取层用于根据所述语义文字向量和所述语义预测向量,获取联合目标函数,并基于所述联合目标函数得到目标语音的指令意图。2.根据权利要求1所述的关于音频数据的意图识别方法,其特征在于,所述根据所述包含目标语音的音频数据,获取语义文字向量,包括:将所述包含目标语音的音频数据转化为初始向量;将所述初始向量映射成语义文字向量。3.根据权利要求2所述的关于音频数据的意图识别方法,其特征在于,所述将所述初始向量映射成语义文字向量,包括:基于所述初始向量,求得隐层向量和槽上下文向量;基于所述隐层向量和所述槽上下文向量,通过softmax函数,求得所述语义文字向量。4.根据权利要求3所述的关于音频数据的意图识别方法,其特征在于,所述槽上下文向量包括注意得分参数,所述注意得分参数用于表示音频数据中的单个字词本身对应的多个具体含义中每个具体含义符合单个字词在上下文中实际含义的概率。5.根据权利要求3所述的关于音频数据的意图识别方法,其特征在于,所述根据所述包含目标语音的音频数据,获取语义预测向量,包括:根据所述包含目标语音的音频数据,获取意图上下文向量;基于所述意图上下文向量,获取语义预测向量。6.根据权利要求5所述的关于音频数据的意图识别方法...

【专利技术属性】
技术研发人员:蒋宇徐敏李鑫豪任纪良
申请(专利权)人:北京宝兰德软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1