一种确定用户意图的方法及装置制造方法及图纸

技术编号：33999639 阅读：27 留言：0更新日期：2022-07-02 11:48

本申请涉及一种确定用户意图的方法及装置，涉及人工智能领域的自然语言理解技术。所述方法包括：获取语音信号对应的语音文本；将所述语音文本分别输入至至少一个基准意图识别模型和至少一个第三方意图识别模型中，经所述至少一个基准意图识别模型输出第一意图集合，经所述至少一个第三方意图识别模型输出第二意图集合，其中，所述第三方意图识别模型被设置为基于相同技能类别的所述基准意图识别模型及其模型训练数据训练得到；根据所述第一意图集合中意图的置信度和所述第二意图集合中意图的置信度确定所述语音文本的意图。中意图的置信度确定所述语音文本的意图。中意图的置信度确定所述语音文本的意图。

全部详细技术资料下载

【技术实现步骤摘要】
一种确定用户意图的方法及装置

[0001]本申请涉及人工智能语音交互
，尤其涉及一种确定用户意图的方法及装置。

技术介绍

[0002]近年来，智能语音交互(Intelligent Speech Interaction)技术得到迅速发展，智能语音交互技术基于语音识别、语音合成、自然语言理解等技术，可以为用户在多种实际应用场景下赋予产品“能听、会说、懂你”式的智能人机交互体验。
[0003]目前，智能语音交互平台往往需要与多个第三方平台的合作，才可以向用户提供丰富的语音技能。典型地，合作的第三方平台主要包括商家、音乐广播平台、天气资讯平台等等。由于第三方平台的数量众多且有很多第三方平台属于同一类型，因此，如何准确地识别用户想要触发哪个平台的哪个技能变得非常重要。通常，智能语音交互平台仅支持对第三方平台开放带有技能唤醒词的技能，这些技能只能通过用户语音文本中带有明确的技能唤醒词才能召回，在一个示例中，可以设置播放音乐的技能唤醒词为“播放音乐”，那么，如果用户需要听某个歌曲，则需要先说出技能唤醒词“播放音乐”，然后再说...

【技术保护点】

【技术特征摘要】
1.一种确定用户意图的方法，其特征在于，包括：获取语音信号对应的语音文本；将所述语音文本分别输入至至少一个基准意图识别模型和至少一个第三方意图识别模型中，经所述至少一个基准意图识别模型输出第一意图集合，经所述至少一个第三方意图识别模型输出第二意图集合，其中，所述第三方意图识别模型基于相同技能类别的所述基准意图识别模型及其模型训练数据训练得到；根据所述第一意图集合中意图的置信度和所述第二意图集合中意图的置信度确定所述语音文本的意图。2.根据权利要求1所述的方法，其特征在于，所述第三方意图识别模型为按照下述方式训练得到：获取预设技能类别的基准意图识别模型及所述基准意图识别模型的模型训练数据，所述模型训练数据至少包括多个预设意图及所述多个预设意图分别对应的基准样本数据、基准模型参数；获取与所述预设技能类别相匹配的第三方样本数据；利用所述模型训练数据和所述第三方样本数据训练所述基准意图识别模型，生成所述第三方意图识别模型。3.根据权利要求2所述的方法，其特征在于，所述获取与所述预设技能类别相匹配的第三方样本数据，包括：获取第三方用户增加的第三方意图和所述第三方意图对应的第三方样本数据，所述第三方意图与所述预设技能类别相匹配，或者，获取第三方用户在所述预设意图对应的基准样本数据的基础上增加的样本数据。4.根据权利要求2所述的方法，其特征在于，所述利用所述模型训练数据和所述第三方样本数据训练所述基准意图识别模型，生成所述第三方意图识别模型，包括：获取第三方用户的用户标识；将所述用户标识与所述第三方样本数据关联；利用所述模型训练数据和关联所述用户标识的所述第三方样本数据训练所述基准意图识别模型，生成所述第三方意图识别模型。5.根据权利要求4所述的方法，其特征在于，所述用户标识包括所述第三方用户对应的品牌名称、APP名称、产品名称中的至少一种。6.根据权利要求1所述的方法，其特征在于，所述根据所述第一意图集合中意图的置信度和所述第二意图集合中意图的置信度确定所述语音文本的意图，包括：在确定所述第一意图集合所包含的意图的置信度都小于等于第一预设阈值，且所述第二意图集合所包含的意图的置信度都大于第二预设阈值的情况下，将所述第二意图集合中置信度最高的意图作为所述语音文本的意图；或者，在确定所述第二意图集合所包含的意图的置信度都小于等于第二预设阈值的情况下，将所述第一意图集合中置信度最高的意图作为所述语音文本的意图；或者，在确定所述第一意图集合所包含的意图的置信度都大于等于第一预设阈值，且所述第二意图集合所包含的意图的置信度都大于第二预设阈值的情况下，将所述第一意图集合和所述第二意图集合中置信度最高的意图作为所述语音文本的意图。
7.根据权利要求6所述的方法，其特征在于，所述第一预设阈值、所述第二预设阈值被设置为分别与对应的技能类别相匹配。8.一种生成意图识别模型的方法，其特征在于，包括：获取第三方用户选取的预设技能类别；获取所述预设技能类别所对应的基准意图识别模型及其模型训练数据；获取来自于所述第三方用户的与所述预设技能类别相匹配的第三方样本数据；利用所述模型训练数据和所述第三方样本数据训练所述基准意图识别模型，生成第三方意图识别模型，所述第三方意图识别模型为对应于所述第三方用户的意图识别模型。9.根据权利要求8所述的方法，其特征在于，所述获取与所述预设技能类别相匹配的第三方样本数据，包括：获取第三方用户增加的第三方意图和所述第三方意图对应的第三方样本数据，所述第三方意图与所述预设技能类别相匹配，或者，获取第三方用户在所述预设意图对应的基准样本数据的基础上增加的样本数据。10.根据权利要求8所述的方法，其特征在于，所述利用所述模型训练数据和所述第三方样本数据训练所述基准意图识别模型，生成所述第三方意图识别模型，包括：获取第三方用户的用户标识；将所述用户标识与所述第三方样本数据关联；利用所述模型训练数据和关联所述用户标识的所述第三方样本数据训练所述基准意图识别模型，生成所述第三方意图识别模型。11.根据权利要求10所述的方法，其特征在于，所述用户标识包括所述第三方用户对应的品牌名称、APP名称、产品名称中的至少一种。12.根据权利要求8所述的方法，其特征在于，在所述生成第三方意图识别模型之后，还包括：获取语音信号对应的语音文本；将所述语音文本分别输入至至少一个基准意图识别模型和至少一个第三方意图识别模型中，经所述至少一个基准意图识别模型输出第一意图集合，经所述至少一个第三方意图识别模型输出第二意图集合；根据所述第一意图集合中意图的置信度和所述第二意图集合中意图的置信度确定所述语音文本的意图。13.一种确定用户意图的装置，其特征在于，包括：语音识别模块，用于获取语音信号对应的语音文本；对话管理模块，用于将所述语音文本分别输入至至少一个基准意图识别模型和至少一个第三方意图识别模型中，经所述至少一个基准意图识别模型输出第一意图集合，经所述至少一个第三方意图识别模型输出第二意图集合，其中，所述第三方意图识别模型基于相同技能类别的所述基准意图识别模型及其模型训练数据训练得到；以及，用于根据所述第一意图集合中意图的置信度和所述第二意图集合中意图的置信度确定所述语音文本的意图。14.根据权利要求13所述的装置，其特征在...

【专利技术属性】
技术研发人员：黄益贵，乔登龙，夏潘斌，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人