对话标签跟踪方法、装置、电子装置及存储介质制造方法及图纸

技术编号:27411525 阅读:26 留言:0更新日期:2021-02-21 14:26
本申请涉及一种对话标签跟踪方法、装置、电子装置及存储介质,其中,对话标签跟踪方法包括:获取对话过程中当前轮对话的第一对话数据,第一对话数据包括参与当前轮对话的用户对应的表述语句;在第一对话数据中跟踪第一标签,并根据第一标签生成第一标签向量,第一标签至少包括当前轮对话的意图信息和实体信息;利用梯度提升模型处理第一标签向量,获得与当前轮对话对应的第一预测值,并根据第一预测值确定当前轮对话的对话标签,梯度提升模型是根据梯度提升算法对第二标签向量进行训练构建的最优梯度提升模型。通过本申请,解决了相关技术中对话标签跟踪泛化能力弱,冷启动场景下对话标签跟踪效果差的问题,提升对话标签跟踪泛化能力。泛化能力。泛化能力。

【技术实现步骤摘要】
对话标签跟踪方法、装置、电子装置及存储介质


[0001]本申请涉及计算机
,特别是涉及对话标签跟踪方法、装置、电子装置及存储介质。

技术介绍

[0002]近几年,人工智能技术得到迅速地发展,与智能语音技术相关的产品已经进入到千家万户中。人们逐渐习惯了与机器对话,并且对机器的理解与应答能力有了更高的期待。基于语音的对话系统框架采用自动语音识别(ASR,Automatic Speech Recognition)模型和自然语言理解(NLU,Natural Language Understanding)模型,工作流程包括:首先通过ASR模型将用户的声音转换为文字,然后利用NLU模型进行语义解析,识别文本意图,最终实现对话文本分析交互。
[0003]相关技术中的对话标签跟踪技术包括基于规则的对话标签跟踪、和基于深度模型的对话标签跟踪。其中,基于规则的对话标签跟踪通过大量的专家知识人工配置DST流转的路径,适合数据冷启动的情况下,但是缺少了模型的泛化能力,基于深度模型的对比标签跟踪(如NBT-DNN,NBT-CNN),能够解决更广泛场景下的问题,但是需要大量的训练数据。
[0004]目前针对相关技术中对话标签跟踪泛化能力弱,冷启动场景下对话标签跟踪效果差的问题,尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种对话标签跟踪方法、装置、电子装置及存储介质,以至少解决相关技术中对话标签跟踪泛化能力弱,冷启动场景下对话标签跟踪效果差的问题。
[0006]第一方面,本申请实施例提供了一种对话标签跟踪方法,包括:
[0007]获取对话过程中当前轮对话的第一对话数据,其中,所述第一对话数据包括参与所述当前轮对话的用户对应的表述语句;
[0008]在所述第一对话数据中跟踪第一标签,并根据所述第一标签生成第一标签向量,其中,所述第一标签至少包括所述当前轮对话的意图信息和实体信息;
[0009]利用梯度提升模型处理所述第一标签向量,获得与所述当前轮对话对应的第一预测值,并根据所述第一预测值确定所述当前轮对话的对话标签,其中,所述梯度提升模型是根据梯度提升算法对第二标签向量进行训练构建的最优梯度提升模型。
[0010]在其中一些实施例中,所述梯度提升模型包括梯度提升决策模型,利用梯度提升模型处理所述第一标签向量,获得与所述当前轮对话对应的第一预测值包括:利用所述梯度提升决策模型对所述第一标签向量进行预测处理,得到与所述第一标签向量对应的残差,确定所述第一预测值包括所述残差。
[0011]在其中一些实施例中,根据所述第一预测值确定所述当前轮对话的对话标签包括:判断所述第一预测值是否大于预设阈值,其中,所述第一预测值包括预测概率值;在判断到所述第一预测值大于预设阈值的情况下,确定所述当前轮对话的对话标签包括所述第
一标签。
[0012]在其中一些实施例中,在判断到所述第一预测值不大于预设阈值的情况下,确定跟踪所述当前轮对话的对话标签失败,并删除所述第一标签。
[0013]在其中一些实施例中,在获取对话过程中当前轮对话的第一对话数据之前,所述方法还包括:获取多轮对话中参于对话的所述用户所产生的第二对话数据;对所述第二对话数据进行按轮拆分,得到每一轮对话的所述第一对话数据。
[0014]在其中一些实施例中,在所述第一对话数据中跟踪第一标签包括:通过预设标签抽取模型对所述第一对话数据进行标签抽取,得到候选标签,其中,所述预设标签抽取模型包括意图分类模型和/或实体识别模型;在所述候选标签中检测预设标签,并在检测到所述预设标签的情况下,确定所述第一标签包括所述预设标签。
[0015]在其中一些实施例中,在所述候选标签中检测预设标签包括:获取所述候选标签的标记值,并根据所述标记值检测得到所述预设标签,其中,所述标记值用于确定所述候选标签是否为预设意向对应的标签。
[0016]在其中一些实施例中,根据所述第一标签生成第一标签向量包括:利用预设特征提取器在所述第一标签中提取多个特征信息,并对所述多个特征信息进行转换处理,得到预设维度的所述第一标签向量,其中,所述特征信息至少包括以下其中一种:肯定语义信息、否定语义信息、语义特征数据。
[0017]第二方面,本申请实施例提供了一种对话标签跟踪装置,包括:
[0018]获取模块,用于获取对话过程中当前轮对话的第一对话数据,其中,所述第一对话数据包括参与所述当前轮对话的用户对应的表述语句;
[0019]跟踪模块,用于在所述第一对话数据中跟踪第一标签,并根据所述第一标签生成第一标签向量,其中,所述第一标签至少包括所述当前轮对话的意图信息和实体信息;
[0020]预测模块,用于利用梯度提升模型处理所述第一标签向量,获得与所述当前轮对话对应的第一预测值,并根据所述第一预测值确定所述当前轮对话的对话标签,其中,所述梯度提升模型是根据梯度提升算法对第二标签向量进行训练构建的最优梯度提升模型。
[0021]第三方面,本申请实施例提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行第一方面所述的对话标签跟踪方法。
[0022]第四方面,本申请实施例提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行第一方面所述的对话标签跟踪方法。
[0023]相比于相关技术,本申请实施例提供的一种对话标签跟踪方法、装置、电子装置及存储介质,通过获取对话过程中当前轮对话的第一对话数据,其中,第一对话数据包括参与当前轮对话的用户对应的表述语句;在第一对话数据中跟踪第一标签,并根据第一标签生成第一标签向量,其中,第一标签至少包括当前轮对话的意图信息和实体信息;利用梯度提升模型处理第一标签向量,获得与当前轮对话对应的第一预测值,并根据第一预测值确定当前轮对话的对话标签,其中,梯度提升模型是根据梯度提升算法对第二标签向量进行训练构建的最优梯度提升模型,解决了相关技术中对话标签跟踪泛化能力弱,冷启动场景下对话标签跟踪效果差的问题,实现了提升对话标签跟踪泛化能力,适用少量样本量的对话跟踪及适用于对话场景的迁移的有益效果。
[0024]本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
[0025]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0026]图1是本专利技术实施例的对话标签跟踪方法运行终端的硬件结构框图;
[0027]图2是根据本申请实施例的对话标签跟踪方法的流程图;
[0028]图3是根据本申请实施例的对话标签跟踪方法的流程图;
[0029]图4是根据本申请实施例的梯度提升模型训练过程的流程图;
[0030]图5是根据本申请实施例的对话标签跟踪装置的结构框图。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话标签跟踪方法,其特征在于,包括:获取对话过程中当前轮对话的第一对话数据,其中,所述第一对话数据包括参与所述当前轮对话的用户对应的表述语句;在所述第一对话数据中跟踪第一标签,并根据所述第一标签生成第一标签向量,其中,所述第一标签至少包括所述当前轮对话的意图信息和实体信息;利用梯度提升模型处理所述第一标签向量,获得与所述当前轮对话对应的第一预测值,并根据所述第一预测值确定所述当前轮对话的对话标签,其中,所述梯度提升模型是根据梯度提升算法对第二标签向量进行训练构建的最优梯度提升模型。2.根据权利要求1所述的对话标签跟踪方法,其特征在于,所述梯度提升模型包括梯度提升决策模型,利用梯度提升模型处理所述第一标签向量,获得与所述当前轮对话对应的第一预测值包括:利用所述梯度提升决策模型对所述第一标签向量进行预测处理,得到与所述第一标签向量对应的残差,确定所述第一预测值包括所述残差。3.根据权利要求1所述的对话标签跟踪方法,其特征在于,根据所述第一预测值确定所述当前轮对话的对话标签包括:判断所述第一预测值是否大于预设阈值,其中,所述第一预测值包括预测概率值;在判断到所述第一预测值大于预设阈值的情况下,确定所述当前轮对话的对话标签包括所述第一标签。4.根据权利要求1所述的对话标签跟踪方法,其特征在于,在判断到所述第一预测值不大于预设阈值的情况下,确定跟踪所述当前轮对话的对话标签失败,并删除所述第一标签。5.根据权利要求1所述的对话标签跟踪方法,其特征在于,在获取对话过程中当前轮对话的第一对话数据之前,所述方法还包括:获取多轮对话中参于对话的所述用户所产生的第二对话数据;对所述第二对话数据进行按轮拆分,得到每一轮对话的所述第一对话数据。6.根据权利要求1所述的对话标签跟踪方法,其特征在于,在所述第一对话数据中跟踪第一标签包括:通过预设标签抽取模型对所述第一对话...

【专利技术属性】
技术研发人员:吴欣辉
申请(专利权)人:杭州大搜车汽车服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1