基于神经网络模型的意图分类方法、系统、终端及介质技术方案

技术编号:31992829 阅读:32 留言:0更新日期:2022-01-22 18:04
本发明专利技术公开了一种基于神经网络模型的意图分类方法,包括:获取意图分类任务数据;针对意图分类数据集撰写正则表达式规则以及对应的逻辑甄选操作;将正则表达式转换为有限状态自动机;将有限状态自动机转换为三维张量;利用张量分解方法分解三维张量,得到三个矩阵初始化TFRNN的参数;初始化逻辑甄选层的参数,将逻辑甄选层和TFRNN构成意图分类模型;将意图分类任务数据输入意图分类模型进行训练,输出意图分类结果。该方法将正则表达式转化为其对应的循环神经网络形式,将这个神经网络正确地初始化,使得在未训练的时候运行神经网络等价于直接运行正则表达式。循环神经网络经过训练后具备非常强的可解释性。后具备非常强的可解释性。后具备非常强的可解释性。

【技术实现步骤摘要】
基于神经网络模型的意图分类方法、系统、终端及介质


[0001]本专利技术涉及软件
,具体涉及一种基于神经网络模型的意图分类方法、系统、终端及介质。

技术介绍

[0002]正则表达式是一种成熟的规则体系,在自然语言处理领域有着重要的应用。由于规则可控、可解释、高精确率的特点,在一些对模型精确率有高要求的自然语言处理应用上是不二的选择。但是基于规则的系统也存在一定的缺陷,例如,需要大量的写规则需要的人工成本,同时也不能很好地利用大量的数据。大数据时代,神经网络作为一种基于数据学习的模型,可以较好的利用大量的数据,学习其中的知识,但是相应的,神经网络也存在明显的缺陷,例如可解释性差,不可控,需要大量标注数据的人工成本,以及难以达到较高的精确率。目前现存的结合正则表达式以及神经网络的方法存在一些缺陷,主流的方法通常借助了多任务学习或者知识蒸馏的方式,例如“LEARNING FROM RULES GENERALIZING LABELED EXEMPLARS“等。虽然能够在下游任务上取得不错的效果,但是它们并没有彻底融合神经网络和正则表达式的优势,规本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络模型的意图分类方法,其特征在于,包括:获取意图分类任务数据;针对意图分类数据集撰写正则表达式规则以及对应的逻辑甄选操作;将正则表达式转换为有限状态自动机;将有限状态自动机转换为三维张量;利用张量分解方法分解三维张量,得到三个矩阵初始化TFRNN的参数;初始化逻辑甄选层的参数,将逻辑甄选层和TFRNN构成意图分类模型;将意图分类任务数据输入意图分类模型进行训练,输出意图分类结果。2.如权利要求1所述的基于神经网络模型的意图分类方法,其特征在于,所述三维张量包含正则表达式的所有信息,第一维度为有限状态自动机涉及的词语的词表大小,第二维度和第三维度为有限状态自动机的状态个数。3.如权利要求1所述的基于神经网络模型的意图分类方法,其特征在于,所述逻辑甄选层包含三种逻辑操作,包括与运算、或运算和优先级甄选。4.如权利要求3所述的基于神经网络模型的意图分类方法,其特征在于,所述优先级甄选的方法为:低优先级分数=低优先级结果-高优先级结果。5.一种基于神经网络模型的意图分类系统,其特征在于,包括:数据获取模块、规则撰写模块、第一转换模块、第二转换模块、张量分解模块、意图分类模型生成模块和训练模块,所述数据获取模块用于获取意图分类任务数据;所述规则撰写模块用于针对意图分类数据集撰写正则表达式规则以及对应的逻辑甄选操作;所述第一转换模块用于将正则表达式转换为有限状态自动机;所述第二转换模块用...

【专利技术属性】
技术研发人员:屠可伟沈李斌蒋承越奚宁李波
申请(专利权)人:上海科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1