基于提示学习的对话行为识别系统技术方案

技术编号：38006082 阅读：6 留言：0更新日期：2023-06-30 10:22

本发明专利技术属于对话行为识别技术领域，具体为一种基于提示学习的对话行为识别，通过设计和优化特定的提示信息，来提高对话行为识别的准确率和泛化能力。引入提示学习，结合手工设计的模板和预训练语言模型，构建一个针对对话行为识别的混合模板，将模板的某些部分视为可调参数(SoftTokens)，在训练过程中进行更新和微调，以此提高模型的准确性和鲁棒性。还采用了语言转化器技术，将标签转化为自然语言描述，进一步提高模型的可解释性和泛化能力。进一步提高模型的可解释性和泛化能力。进一步提高模型的可解释性和泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
基于提示学习的对话行为识别系统

[0001]本专利技术属于对话行为识别
，具体是利用提示学习(Prompt Learning)的方法，通过设计和优化特定的提示信息，来提高对话行为识别的准确率和泛化能力。

技术介绍

[0002]对话行为识别是自然语言处理领域的一个重要研究方向，其主要目的是自动识别对话文本中的不同行为，如陈述、提问、命令等。在过去的几十年中，人们提出了许多方法和技术来解决这个问题。
[0003]早期的对话行为识别方法主要基于人工设计的特征和规则，通过分析文本中的语法和语义信息来识别不同的对话行为。然而，这种方法难以处理复杂的语义信息，且需要大量的人工劳动力和时间。
[0004]随着机器学习和深度学习技术的发展，基于机器学习和深度学习的方法逐渐成为了对话行为识别的主流方法。其中，基于支持向量机(SVM)、朴素贝叶斯分类器等传统机器学习方法被广泛应用于对话行为识别任务，通过训练分类器来对文本进行分类。然而，这些方法仍然需要人工设计的特征，难以处理复杂的语义信息。
[0005]近年来，随着深度学习技术的发展和预训练语言模型的出现，对话行为识别任务取得了更加显著的进展。例如，BERT、RoBERTa等预训练语言模型在对话行为识别任务中取得了非常显著的效果，并逐渐成为对话行为识别的主流方法。这些模型利用大规模语料库进行预训练，然后在特定的任务上进行微调，可以显著提高对话行为识别的准确率和泛化能力。
[0006]除了预训练语言模型，还有一些基于深度学习的方法被应用于对话行为识别...

【技术保护点】

【技术特征摘要】
1.基于提示学习的对话行为识别系统，其特征在于，包括以下步骤：(1)设计提示学习模板：对于对话行为识别任务，采用混合模板mixed template的提示学习模板，由多个文本片段组成，每个文本片段中包含一个或多个词元token，每个token被标记为硬性或软性，硬性token在训练和推理时必须被固定，而软性token则在训练和推理时被替换成其他词汇，mixed template中的每个文本片段都可以包含一个或多个硬性token和软性token；使用混合模板mixed template来约束模型的输入和输出格式，并根据任务要求设计合适的硬性token和软性token；(2)提示学习利用模板和相应的知识来指导模型学习；(3)预训练BERT模型：使用预训练BERT模型来提取输入文本的特征表示，并利用这些特征来进行训练和预测；使用预训练的BERT模型作为基础模型，通过在其输入中添加自定义的提示文本，指导模型学习特定任务；(4)构建语言转化器：在提示学习中，语言转化器Verbalizer指将模型输出映射到自然语言文本的过程。2.根据权利要求1所述的基于提示学习的对话行为识别系统，其特征在于，预训练BERT模型的训练数据来源于大规模的无标注文本数据，从中学习到的语言模型能力可以被用于下游任务中。3.根据权利要求1所述的基于提示学习的对话行为识别系统，其特征在于，在混合标记解析完成后，可以准备生成输入的soft token词嵌入embedding，对于每个soft token，使用BERT预训练模型中的输入embedding来初始化其embedding；在计算过程中，对于当前输入的批次batch，首先将其输入数据input_ids通过BERT的原始embedding层获取其输入embedding；然后，使用另外一个embedding层，即soft_embedding层，生成所有soft token的embedding；这个embedding层的初始化来自BERT预训练模型中的原始embedding层，但会在后面的fine
‑
tune过程中被调整；接着，根据软词元编码soft_token_ids中的信息，选择应该使用哪个embedding；如果一个token的soft_token_ids中的值为0，那么就使用原始embedding；否则，使用生成的soft embedding，最终输出的是输入embedding的组合；若令e
iorig
表示第i个token的原始embedding，e
isoft
表示第i个token的soft embedding，对于输入batch中的每个token，其最终embedding可以表示为：在计算过程中，soft_token_ids会被不断更新，以便每个soft token都能够正确地与其对应的hard token相匹配；具体而言，根据模板中的soft token信息，为每个soft token分配唯一的ID，并将其放入身份列表id_list中；如果存在多个soft token对应一个hard token的情况，将它们放在同一个id_list中；之后，将id_list放入soft_token...

【专利技术属性】
技术研发人员：杨鹏飞，庄志强，司宇珂，王龙标，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人