一种多任务意图分类方法、装置、设备及存储介质制造方法及图纸

技术编号:25439322 阅读:39 留言:0更新日期:2020-08-28 22:27
本发明专利技术公开了一种多任务意图分类方法、装置、设备及存储介质,该方法包括:获取文本信息,将文本信息转换为词向量;将词向量转换为第一隐藏状态向量;利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。该方法实现避免槽位标记,节省人工成本。

【技术实现步骤摘要】
一种多任务意图分类方法、装置、设备及存储介质
本专利技术涉及计算机
,特别是涉及一种多任务意图分类方法、装置、设备及存储介质。
技术介绍
目前,智能机器人交互是实现城市智能化的一项重要工作。近年来,随着计算机集群计算能力的大幅度提升,人工智能算法研究和产业落地步入了发展快车道,而智能机器人交互作为人工智能重要分支——自然语言处理的一个重要应用,也逐渐成为学术界、工业界重点投入的研究热点和产品方向。无论在教育领域,金融领域,还是医疗领域都有着广泛的应用,通过使用智能机器人,可以提高效率,减少人力资源。智能机器人交互对社会经济效益和国家科技发展都具有重大意义。命名实体识别在智能机器人交互系统中,需要从用户的提问中准确的识别出各种实体的类型才能更好地回答用户,例如:“我想订一张后天从杭州到三亚的机票?”“从三亚飞杭州的机票多少钱?”,分别需要准确地识别出“后天”,“三亚”和“杭州”才能准确回答用户的问题。对话系统需要接收纯文本形式的自然语言,必需经过实体识别将无结构化的数据转化为结构化数据,才能进行后续的意图识别等步骤。意图识别也被称为SUC(SpokenUtteranceClassification),是将用户输入的自然语言会话进行划分,类别(classification)对应的就是用户意图。例如“今天天气如何”,其意图为“询问天气”。自然地,可以将意图识别看作一个典型的分类问题。意图的分类和定义可参考ISO-24617-2标准,其中共有56种详细的定义。面向任务的对话系统中的意图识别通常可以视为文本分类任务。同时,意图的定义与对话系统自身的定位和所具有的知识库有很大关系,即意图的定义具有非常强的领域相关性。意图分类是口语理解(SLU)系统中的重要任务。现有技术中,开始联合处理意图分类(ID)和填槽(SF)任务一起完成多任务意图分类处理。但是,当前的联合模型需要大量手动标注的数据样本,手动标注数据需要很多成本,尤其是槽位标记。因此,如何避免槽位标记,节省人工成本是亟待解决的问题。
技术实现思路
本专利技术的目的是提供一种多任务意图分类方法、装置、设备及存储介质,以实现避免槽位标记,节省人工成本。为解决上述技术问题,本专利技术提供一种多任务意图分类方法,包括:获取文本信息,将文本信息转换为词向量;将词向量转换为第一隐藏状态向量;利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。优选的,所述将文本信息转换为词向量,包括:从文本信息中提取词信息;将词信息进行向量转换,生成词向量。优选的,所述将词向量转换为第一隐藏状态向量,包括:将词向量输入至第一双向LSTM神经网络,输出得到第一隐藏状态向量。优选的,所述利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果,包括:将第一隐藏状态向量输入至意图分类任务,执行意图分类任务得到意图分类结果;将第一隐藏状态向量输入至命名实体识别任务,执行命名实体识别任务得到实体识别结果。优选的,所述将第一隐藏状态向量输入至意图分类任务,执行意图分类任务得到意图分类结果,包括:将第一隐藏状态向量输入至第二双向LSTM神经网络,输出得到对话意图;将对话意图输入至softmax分类层,输出得到意图分类结果。优选的,所述第一隐藏状态向量输入至命名实体识别任务,执行命名实体识别任务得到实体识别结果,包括:将第一隐藏状态向量输入至单向LSTM神经网络,输出得到第二隐藏状态向量;将第二隐藏状态向量输入至条件随机场CRF,输出得到实体识别结果。优选的,所述将词向量转换为第一隐藏状态向量之后,还包括:对第一隐藏状态向量进行正则化,得到正则化结果。本专利技术还提供一种多任务意图分类装置,包括:第一转换模块,用于获取文本信息,将文本信息转换为词向量;第二转换模块,用于将词向量转换为第一隐藏状态向量;执行模块,用于利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。本专利技术还提供一种多任务意图分类设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上任一项所述的多任务意图分类方法的步骤。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的多任务意图分类方法的步骤。本专利技术所提供的一种多任务意图分类方法、装置、设备及存储介质,获取文本信息,将文本信息转换为词向量;将词向量转换为第一隐藏状态向量;利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。可见,不再是联合意图分类任务和填槽任务,而是利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,即使用命名实体识别任务替换联合模型中的填槽任务,联合意图分类任务和命名实体识别任务实现多任务意图分类,避免槽位标记,节省人工成。并且,由于意图分类任务和命名实体识别任务共同使用了底层的共享特征,提升了意图分类任务的意图分类结果准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术所提供的一种多任务意图分类方法的流程图;图2为多任务意图分类模型示意图;图3为意图分类单任务模型示意图;图4为本专利技术所提供的一种多任务意图分类装置结构示意图;图5为本专利技术所提供的一种多任务意图分类设备结构示意图。具体实施方式本专利技术的核心是提供一种多任务意图分类方法、装置、设备及存储介质,以实现避免槽位标记,节省人工成本。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术所提供的一种多任务意图分类方法的流程,该方法包括以下步骤:S11:获取文本信息,将文本信息转换为词向量;S12:将词向量转换为第一隐藏状态向量;S13:利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。可见,本方法不再是联合意图分类任务和填槽任务,而是利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,即使用命名实体识别任务替换联合模型中的填槽任务,联合意图分类任务和命名实体识本文档来自技高网
...

【技术保护点】
1.一种多任务意图分类方法,其特征在于,包括:/n获取文本信息,将文本信息转换为词向量;/n将词向量转换为第一隐藏状态向量;/n利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。/n

【技术特征摘要】
1.一种多任务意图分类方法,其特征在于,包括:
获取文本信息,将文本信息转换为词向量;
将词向量转换为第一隐藏状态向量;
利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。


2.如权利要求1所述的方法,其特征在于,所述将文本信息转换为词向量,包括:
从文本信息中提取词信息;
将词信息进行向量转换,生成词向量。


3.如权利要求1所述的方法,其特征在于,所述将词向量转换为第一隐藏状态向量,包括:
将词向量输入至第一双向LSTM神经网络,输出得到第一隐藏状态向量。


4.如权利要求1所述的方法,其特征在于,所述利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果,包括:
将第一隐藏状态向量输入至意图分类任务,执行意图分类任务得到意图分类结果;
将第一隐藏状态向量输入至命名实体识别任务,执行命名实体识别任务得到实体识别结果。


5.如权利要求4所述的方法,其特征在于,所述将第一隐藏状态向量输入至意图分类任务,执行意图分类任务得到意图分类结果,包括:
将第一隐藏状态向量输入至第二双向LSTM神经网络,输出得到对话意图;
将对话意图输入至softmax分类层,输出...

【专利技术属性】
技术研发人员:李净
申请(专利权)人:北京慧闻科技集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1