一种关于音频数据的意图识别方法及装置制造方法及图纸

技术编号：35430306 阅读：18 留言：0更新日期：2022-11-03 11:34

本发明专利技术提供一种关于音频数据的意图识别方法及装置，方法包括：获取包含目标语音的音频数据；将包含目标语音的音频数据输入预先训练的联合模型，得到目标语音的指令意图；其中，联合模型是基于样本音频数据训练得到的，包括语义槽填充层、意图预测层和指令意图获取层；其中，语义槽填充层用于根据包含目标语音的音频数据，获取语义文字向量；意图预测层用于根据包含目标语音的音频数据，获取语义预测向量；指令意图获取层用于根据语义文字向量和语义预测向量，获取联合目标函数，并基于联合目标函数得到目标语音的指令意图。本发明专利技术通过联合模型深层次的理解用户意图，对目标语音的多种意图进行精确高效识别，得到目标语音的指令意图。意图。意图。

全部详细技术资料下载

【技术实现步骤摘要】
一种关于音频数据的意图识别方法及装置

[0001]本专利技术涉及人工智能
，尤其涉及一种关于音频数据的意图识别方法及装置。

技术介绍

[0002]近些年随着自然语言处理、知识图谱等相关技术的发展，问答系统已经扩展到了众多领域。通过与运维机器人进行人机交互，以一问一答的方式轻松完成运维动作，可以大幅度提高运维人员工作效率，而意图识别(Intent Detection)是人机对话系统构成的关键。
[0003]现有的运维机器人更多的是某一独立功能的问答系统，用户在不同的场合下可能会有不同意图，因而会涉及人机对话系统中的多个领域，其中包括任务型垂直领域和闲聊等。任务型垂直领域的意图文本具有主题鲜明，易于检索的特点，比如，查询内存使用率、CPU使用率等。而聊天类意图文本一般具有主题不明确，语义宽泛、语句简短等特点，注重在开放域上与人类进行交流。在对话系统中只有明确了用户的话题领域，才能正确分析用户的具体需求，否则会造成后面意图的错误识别。
[0004]现有的技术是基于规则模板的单意图识别方法，基于规则模板的意图识别方法一般需要人为构建规则模板以及类别信息对用户意图文本进行分类。现有技术针对消费意图识别，基于规则和图的方法来获取意图模板，在单一领域取得了较好的分类效果。后来发现在同一领域下，不同的表达方式会导致规则模板数量的增加,需要耗费大量的人力物力。所以，基于规则模板匹配的方法虽然不需要大量的训练数据，就可以保证识别的准确性，但是却无法解决意图文本更换类别时带来重新构造模板的高成本问题，也就是说，现有技...

【技术保护点】

【技术特征摘要】
1.一种关于音频数据的意图识别方法，其特征在于，包括：获取包含目标语音的音频数据；将所述包含目标语音的音频数据输入预先训练的联合模型，得到目标语音的指令意图；其中，所述联合模型是基于样本音频数据训练得到的，包括语义槽填充层、意图预测层和指令意图获取层；其中，所述语义槽填充层用于根据所述包含目标语音的音频数据，获取语义文字向量；所述意图预测层用于根据所述包含目标语音的音频数据，获取语义预测向量；所述指令意图获取层用于根据所述语义文字向量和所述语义预测向量，获取联合目标函数，并基于所述联合目标函数得到目标语音的指令意图。2.根据权利要求1所述的关于音频数据的意图识别方法，其特征在于，所述根据所述包含目标语音的音频数据，获取语义文字向量，包括：将所述包含目标语音的音频数据转化为初始向量；将所述初始向量映射成语义文字向量。3.根据权利要求2所述的关于音频数据的意图识别方法，其特征在于，所述将所述初始向量映射成语义文字向量，包括：基于所述初始向量，求得隐层向量和槽上下文向量；基于所述隐层向量和所述槽上下文向量，通过softmax函数，求得所述语义文字向量。4.根据权利要求3所述的关于音频数据的意图识别方法，其特征在于，所述槽上下文向量包括注意得分参数，所述注意得分参数用于表示音频数据中的单个字词本身对应的多个具体含义中每个具体含义符合单个字词在上下文中实际含义的概率。5.根据权利要求3所述的关于音频数据的意图识别方法，其特征在于，所述根据所述包含目标语音的音频数据，获取语义预测向量，包括：根据所述包含目标语音的音频数据，获取意图上下文向量；基于所述意图上下文向量，获取语义预测向量。6.根据权利要求5所述的关于音频数据的意图识别方法...

【专利技术属性】
技术研发人员：蒋宇，徐敏，李鑫豪，任纪良，
申请(专利权)人：北京宝兰德软件股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人