一种通过领域迁移和对抗学习的意图识别方法技术

技术编号:25398045 阅读:61 留言:0更新日期:2020-08-25 23:02
一种通过领域迁移和对抗学习的意图识别方法,涉及数据处理分析技术领域,包括以下步骤:步骤1):采用一个预训练模型抽取器对大量已标注数据和未标注数据进行特征抽取;步骤2):抽取输入为每个对话的输入句子,通过抽取器表示为一段语义向量;步骤3):将语义向量输入到一个映射层,来源数据对应来源映射层,目标数据映射到目标映射层;步骤4):目标映射层通过一个分类器,辨别输出的是否真实的目标数据。本发明专利技术抑制目标数据领域分类器的效能,针对目标数据构造了真实标签和虚假标签,以此达到对抗学习的效果,可将来源数据以及其映射层和分类器被提前训练,提高了准确率,减少了人力物力的成本消耗。

【技术实现步骤摘要】
一种通过领域迁移和对抗学习的意图识别方法
本专利技术涉及数据处理分析
,具体为一种通过领域迁移和对抗学习的意图识别方法。
技术介绍
意图识别作为模块化对话系统的一个组件,起到了识别用户意图,判断对话领域的作用,目前的意图识别任务通常被作为机器学习中的分类模型进行建模,使用的学习方式多为有监督学习,有监督学习是给定一段数据表示和对应标签,对模型判别能力进行训练。然而,有监督的分类学习成功建立与一个假设之上,即训练数据的数据分布和测试数据一致或者相似,但是在真实世界,这一假设往往不存在;其次,有监督学习需要大量的标注数据进行模型训练,这带来了人力物力的成本消耗。
技术实现思路
(一)解决的技术问题针对现有技术的不足,本专利技术提供了一种通过领域迁移和对抗学习的意图识别方法,解决了有监督的分类学习成功建立与一个假设之上,即训练数据的数据分布和测试数据一致或者相似,但是在真实世界,这一假设往往不存在;其次,有监督学习需要大量的标注数据进行模型训练,这带来了人力物力的成本消耗的问题。(二)技术方案为实现以本文档来自技高网...

【技术保护点】
1.一种通过领域迁移和对抗学习的意图识别方法,其特征在于:包括以下步骤:/n步骤1):采用一个预训练模型抽取器对大量已标注数据和未标注数据进行特征抽取;/n步骤2):抽取输入为每个对话的输入句子,通过抽取器表示为一段语义向量;/n步骤3):将语义向量输入到一个映射层,来源数据对应来源映射层,目标数据映射到目标映射层;/n步骤4):目标映射层通过一个分类器,辨别输出的是否真实的目标数据。/n

【技术特征摘要】
1.一种通过领域迁移和对抗学习的意图识别方法,其特征在于:包括以下步骤:
步骤1):采用一个预训练模型抽取器对大量已标注数据和未标注数据进行特征抽取;
步骤2):抽取输入为每个对话的输入句子,通过抽取器表示为一段语义向量;
步骤3):将语义向量输入到一个映射层,来源数据对应来源映射层,目标数据映射到目标映射层;
步骤4):目标映射层通过一个分类器,辨别输出的是否真实的目标数据。


2.根据权利要求1所述的一种通过领域迁移和对抗学习的意图识别方法,其特征在于:所述预训练模型抽取器采用中文ERNIE模型。


3.根...

【专利技术属性】
技术研发人员:周柳阳董世超赵勇
申请(专利权)人:深圳市一号互联科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1