可在线纠错更新的意图识别方法及装置制造方法及图纸

技术编号:20655104 阅读:30 留言:0更新日期:2019-03-23 06:48
本发明专利技术涉及自然语言处理技术领域,人工智能领域以及人机交互技术领域,其公开了一种可在线纠错更新的意图识别方法及装置,解决现有意图识别模型不能在线纠错更新,不能满足用户差异化意图识别需求的问题。本发明专利技术中,先将输入文本进行初步意图识别,若意图识别结果不符合用户要求,将预设的意图种类标签反馈展示给用户,将用户对意图种类标签的选择和对应的输入数据组合成在线纠错更新训练样本,根据在线纠错更新训练样本和训练数据集生成用户在线纠错更新训练数据集,采用意图识别基础模型对用户在线纠错更新训练数据集进行训练得到用户在线纠错更新意图识别模型,如此可实现根据用户进行意图识别模型的在线纠错更新,使得用户在线纠错更新意图识别模型识别的准确率更高,也能更快的响应用户的纠错更新需求,提高用户使用的满意度。

【技术实现步骤摘要】
可在线纠错更新的意图识别方法及装置
本专利技术涉及自然语言处理
,人工智能领域以及人机交互
,具体涉及一种可在线纠错更新的意图识别方法及装置。
技术介绍
意图识别方法可以根据文本内容识别该文本的意图,它可以应用于多个领域。随着人工智能的飞速发展,在各种环境下智能设备的应用越来越多,智能设备需要识别用户的意图并以向用户提供相应的服务。例如,用户向智能音响说出“我想听周杰伦的歌曲”,则识别出用户的意图是随机播放周杰伦演唱的一首音乐,或者,用户向智能扫地机器人说出“我要打扫客厅”,则机器人识别出用户的意图是打扫客厅的地面。目前,现有技术中的意图识别模型,虽然在理想测试集内取得较高的识别率,但在真实用户使用过程中,由于用户个体差异、表达习惯、口语化等差异以及模型自身性能的原因,总会出现各种错误,对于这些识别错误的情况,现有模型没有提供供用户交互反馈的方式,更不能及时纠错更新这些错误,严重影响用户体验。针对相关技术中的对用户的差异化意图识别的需求,目前尚未提出有效的解决方案。
技术实现思路
本专利技术所要解决的技术问题是:提出一种可在线纠错更新的意图识别方法及装置,解决现有意图识别模型不能在线纠错更新,不能满足用户差异化意图识别需求的问题。本专利技术解决上述技术问题所采用的技术方案是:可在线纠错更新的意图识别装置,包括:所述用户交互模块,包括获取文本单元和输出显示单元;所述获取文本单元,用于获取用户输入的文本信息;所述输出显示单元,用于通过显示屏展示客户端或服务端反馈的输出结果;所述意图识别模块,包括第一意图识别单元、第二意图识别单元和模型更新单元;所述第一意图识别单元,用于根据输入的文本信息,通过与存储模块内的用户在线纠错更新语料库进行匹配并识别,若无法识别,则将待识别文本传入到第二意图识别单元;所述第二意图识别单元,用于根据第一意图识别单元传入的文本信息,采用预先根据任务需求和任务标注语料训练得到的意图识别基础模型进行意图识别;所述模型更新单元,用于接收服务器端发送的新的模型,并在获得用户确认后,将新模型更新到意图识别单元;数据存储模块,用于存储用户纠错更新的意图识别训练语料,生成用户在线纠错更新的意图识别训练语料库;在线纠错更新模型训练模块,该模块设置在服务器端,通过数据存储模块中存储的用户在线纠错更新的意图识别训练语料库,重新训练基础意图识别模型,得到新的用户在线纠错更新的意图识别模型,并将新的模型发送到客户端意图识别模块的模型更新单元。作为进一步优化,所述数据存储模块位于本地客户端,通过定期上传或者用户操作上传方式存储用户在线纠错更新的训练语料库,并且负责与第一意图识别单元的交互通信。作为进一步优化,所述用户交互模块还包括数据转换单元,所述数据转换单元用于在输入数据不是文本类型的输入数据时,将输入数据转换为文本类型的输入数据;和/或,所述用户交互模块还包括显示屏单元或者语音单元,所述显示屏单元用于将预设的意图种类标签反馈展示给用户时,通过显示屏以文本的方式将预设的意图种类标签反馈展示给用户;所述语音单元用于将预设的意图种类标签反馈展示给用户时,通过语音设备以语音的方式将预设的意图种类标签反馈展示给用户。作为进一步优化,所述第二意图识别单元包括意图识别基础模型生成单元,所述意图识别基础模型生成单元用于:将训练数据集根据预设的意图种类标签进行分类,生成分类标签文本;将训练数据集进行分词处理得到分词文本,对分词文本进行训练得到词向量,词向量向量化训练数据集得到词向量矩阵文本;将分类标签文本和词向量矩阵文本输入到预先建立的神经网络模型中进行迭代训练得到意图识别基础模型。此外,基于上述可在线纠错更新的意图识别装置,本专利技术还提供了一种可在线纠错更新的意图识别方法,其包括以下步骤:步骤1、获取文本:获取用户输入的多模态输入,并对所述多模态输入进行多模态输入转化,将其转化为文本;或者,直接获得用户输入的文本信息;步骤2、初步意图识别:将步骤1获取的文本,先通过第一意图识别单元进行识别,若不能识别用户意图,再使用第二意图识别单元中预先根据任务需求和任务标注语料训练得到的意图识别基础模型,进行意图识别,得到候选意图;步骤3、与用户进行交互纠错更新:将步骤2获得的候选意图结果反馈给用户,如果用户判断识别结果错误,则用户通过多模态输入或文本输入的方式反馈给客户端;客户端将预设的意图种类标签反馈展示给用户,将用户对意图种类标签的选择和对应的输入数据组合成在线纠错更新训练样本,生成用户在线纠错更新的训练语料库;步骤4、训练用户在线纠错更新意图识别模型:用户通过客户端发送生成纠错更新模型的请求,服务器使用步骤3生成的用户在线纠错更新的训练语料库筛选训练样本,并将筛选后的训练样本替换原基础模型的训练样本,在原基础意图识别模型的基础上,重新进行训练,得到用户在线纠错更新意图识别模型;步骤5、客户端意图识别模型更新:通过客户端询问用户是否进行模型更新,得到用户确认更新的命令后,将所述用户在线纠错更新意图识别模型发送到对应的客户端,完成模型的更新;步骤6、采用用户在线纠错更新意图识别模型进行用户意图的识别。作为进一步优化,步骤2中,所述第二意图识别单元中预先根据任务需求和任务标注语料训练得到意图识别基础模型的方法是:根据任务要求,获得并标注一定数量的文本样本与期望输出意图主题词,生成任务相关的训练语料库;将训练语料库中的数据输入到预先建立的神经网络结构中进行多次训练,通过迭代训练后得到神经网络结构,获得所述意图识别基础模型;所述神经网络结构,根据任务性质需求不同,包括:多层感知机以及其它变种等;卷积神经网络结构以及其它变种等;循环神经网络结构以及其它变种等。作为进一步优化,步骤3中,所述训练样本缓存到客户端本地的数据存储模块,或者是通过网络上传到服务器端的数据存储模块;在线纠错更新的训练语料库存放在客户端本地的数据存储模块或者存放在服务器端的数据存储模块。作为进一步优化,步骤4中,服务器在接收到生成纠错更新模型的请求后,将保存在客户端的用户在线纠错更新的训练语料库,通过网络上传到服务器端,在原意图识别基础模型上,重新进行训练,得到用户纠错更新的意图识别模型;或者是,服务器在接收到生成纠错更新模型的请求后,直接使用保存在服务器端的用户在线纠错更新的训练语料库重新进行训练,得到用户在线纠错更新的意图识别模型。作为进一步优化,步骤4中,所述的重新进行训练过程,具体包括:将用户在线纠错更新的训练语料库中的所有训练语料,通过服务器筛选后,添加到原意图识别的训练预料库中,并替换掉原错误样本,进行训练,得到用户在线纠错更新的意图识别模型。作为进一步优化,步骤5中,服务器端完成用户在线纠错更新意图识别模型的生成后,会在客户端向用户发送模型更新提醒,通过交互的方式,用户可选择立即更新或是稍后更新。本专利技术的有益效果是:若意图识别结果不符合用户要求,将预设的意图种类标签反馈展示给用户,将用户对意图种类标签的选择和对应的输入数据组合成在线纠错更新训练样本,根据在线纠错更新训练样本和训练数据集生成用户在线纠错更新训练数据集,采用意图识别基础模型对用户在线纠错更新训练数据集进行训练得到用户在线纠错更新意图识别模型,如此可实现根据用户进行意图识别模型的在线纠本文档来自技高网...

【技术保护点】
1.可在线纠错更新的意图识别装置,其特征在于,包括:所述用户交互模块,包括获取文本单元和输出显示单元;所述获取文本单元,用于获取用户输入的文本信息;所述输出显示单元,用于通过显示屏展示客户端或服务端反馈的输出结果;所述意图识别模块,包括第一意图识别单元、第二意图识别单元和模型更新单元;所述第一意图识别单元,用于根据输入的文本信息,通过与存储模块内的用户在线纠错更新语料库进行匹配并识别,若无法识别,则将待识别文本传入到第二意图识别单元;所述第二意图识别单元,用于根据第一意图识别单元传入的文本信息,采用预先根据任务需求和任务标注语料训练得到的意图识别基础模型进行意图识别;所述模型更新单元,用于接收服务器端发送的新的模型,并在获得用户确认后,将新模型更新到意图识别单元;数据存储模块,用于存储用户纠错更新的意图识别训练语料,生成用户在线纠错更新的意图识别训练语料库;在线纠错更新模型训练模块,该模块设置在服务器端,通过数据存储模块中存储的用户在线纠错更新的意图识别训练语料库,重新训练基础意图识别模型,得到新的用户在线纠错更新的意图识别模型,并将新的模型发送到客户端意图识别模块的模型更新单元。

【技术特征摘要】
1.可在线纠错更新的意图识别装置,其特征在于,包括:所述用户交互模块,包括获取文本单元和输出显示单元;所述获取文本单元,用于获取用户输入的文本信息;所述输出显示单元,用于通过显示屏展示客户端或服务端反馈的输出结果;所述意图识别模块,包括第一意图识别单元、第二意图识别单元和模型更新单元;所述第一意图识别单元,用于根据输入的文本信息,通过与存储模块内的用户在线纠错更新语料库进行匹配并识别,若无法识别,则将待识别文本传入到第二意图识别单元;所述第二意图识别单元,用于根据第一意图识别单元传入的文本信息,采用预先根据任务需求和任务标注语料训练得到的意图识别基础模型进行意图识别;所述模型更新单元,用于接收服务器端发送的新的模型,并在获得用户确认后,将新模型更新到意图识别单元;数据存储模块,用于存储用户纠错更新的意图识别训练语料,生成用户在线纠错更新的意图识别训练语料库;在线纠错更新模型训练模块,该模块设置在服务器端,通过数据存储模块中存储的用户在线纠错更新的意图识别训练语料库,重新训练基础意图识别模型,得到新的用户在线纠错更新的意图识别模型,并将新的模型发送到客户端意图识别模块的模型更新单元。2.如权利要求1所述的可在线纠错更新的意图识别装置,其特征在于,所述数据存储模块位于本地客户端,通过定期上传或者用户操作上传方式存储用户在线纠错更新的训练语料库,并且负责与第一意图识别单元的交互通信。3.如权利要求1所述的可在线纠错更新的意图识别装置,其特征在于,所述用户交互模块还包括数据转换单元,所述数据转换单元用于在输入数据不是文本类型的输入数据时,将输入数据转换为文本类型的输入数据;和/或,所述用户交互模块还包括显示屏单元或者语音单元,所述显示屏单元用于将预设的意图种类标签反馈展示给用户时,通过显示屏以文本的方式将预设的意图种类标签反馈展示给用户;所述语音单元用于将预设的意图种类标签反馈展示给用户时,通过语音设备以语音的方式将预设的意图种类标签反馈展示给用户。4.如权利要求1所述的可在线纠错更新的意图识别装置,其特征在于,所述第二意图识别单元包括意图识别基础模型生成单元,所述意图识别基础模型生成单元用于:将训练数据集根据预设的意图种类标签进行分类,生成分类标签文本;将训练数据集进行分词处理得到分词文本,对分词文本进行训练得到词向量,词向量向量化训练数据集得到词向量矩阵文本;将分类标签文本和词向量矩阵文本输入到预先建立的神经网络模型中进行迭代训练得到意图识别基础模型。5.可在线纠错更新的意图识别方法,应用于如权利要求1-4任意一项所述的可在线纠错更新的意图识别装置中,其特征在于,其包括以下步骤:步骤1、获取文本:获取用户输入的多模态输入,并对所述多模态输入进行多模态输入转化,将其转化为文本;或者,直接获得用户输入的文本信息;步骤2、初步意图识别:将步骤1获取的文本,先通过第一意图识别单元进行识别,若不能识别用户意图,再使用第二意图识别单元中预先根据任务需求和任务标注...

【专利技术属性】
技术研发人员:谭斌许洛孙锐展华益王欣杨兰饶璐
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1