意图识别系统及方法技术方案

技术编号:24799559 阅读:29 留言:0更新日期:2020-07-07 21:03
本发明专利技术公开一种意图识别系统,包括:顺序连接的编码模块和分类模块,其中,所述编码模块配置为获取待识别文本的语义特征向量;所述分类模块配置为根据所述待识别文本的语义特征向量从预设的多个样本意图类别原型中确定所述待识别文本的文本意图。本发明专利技术实现了对于小样本领域的文本的意图识别,解决了现有技术中对小样本领域的文本进行意图识别所存在的耗时耗力,且泛化性差,训练成本太高的问题。

【技术实现步骤摘要】
意图识别系统及方法
本专利技术涉及人工智能
,尤其涉及一种意图识别系统及方法。
技术介绍
现有技术中实现小样本意图识别的方法有:基于数据增强的小样本意图识别和基于语言模型fine-tune的小样本意图识别。基于数据增强的小样本意图识别:意图识别本质就是文本分类,文本分类的性能好坏与人工标注数据的多少有着直接的关系。实际的项目研究中,特别是刚起步阶段,每种意图的人工标注数据特别少,一是标注成本太高,二是冷启动项目的待标注样本本身就很少。基于数据增强的算法,大多是采用规则、回译等手段来增加每种意图的样本个数。其中,规则指的是使用正则表达式对每种意图样本中的关键词做同义词替换,以此来增加样本的个数;回译指的是通过翻译软件把中文样本翻译成各种第三方语言,然后再翻译回来,通过这种方式增加每种意图的样本个数。最后,当所有意图的样本个数达到要求之后,就可以采用传统文本分类算法如SVM、LR、GBDT或者深度学习算法如CNN、LSTM、Transformer等完成意图的识别。基于语言模型fine-tune的小样本意图识别:这种方法是首先在大规模、本文档来自技高网...

【技术保护点】
1.一种意图识别系统,包括:顺序连接的编码模块和分类模块,其中,所述编码模块配置为获取待识别文本的语义特征向量;/n所述分类模块配置为根据所述待识别文本的语义特征向量从预设的多个样本意图类别原型中确定所述待识别文本的文本意图。/n

【技术特征摘要】
1.一种意图识别系统,包括:顺序连接的编码模块和分类模块,其中,所述编码模块配置为获取待识别文本的语义特征向量;
所述分类模块配置为根据所述待识别文本的语义特征向量从预设的多个样本意图类别原型中确定所述待识别文本的文本意图。


2.根据权利要求1所述的系统,其中,所述多个样本意图类别原型中的每一个样本意图类别原型由各自对应的多个样本待识别文本的语义特征向量的均值确定;
所述根据所述待识别文本的语义特征向量从预设的多个样本意图类别原型中确定所述待识别文本的文本意图包括:
计算所述待识别文本的语义特征向量与预设的多个样本意图类别原型之间的相似度值;
根据计算得到的最大相似度值所对应的样本意图类别原型确定所述待识别文本的文本意图。


3.根据权利要求1所述的系统,其中,所述系统还包括设置于所述编码模块和所述分类模块之间的映射模块,所述编码模块、映射模块和分类模块构成端到端意图识别模型,所述多个样本意图识别原型基于小样本训练集训练得到;
所述映射模块配置为将所述待识别文本的语义特征向量映射到意图类别原型;
所述根据所述待识别文本的语义特征向量从预设的多个样本意图类别原型中确定所述待识别文本的文本意图包括:
根据所述待识别文本的意图类别原型从预设的多个样本意图类别原型中确定所述待识别文本的文本意图。


4.根据权利要求3所述的系统,其中,所述编码器采用CNN神经网络或者RNN神经网络或者Transformer网络结构;所述分类模块基于前馈神经网络构成。


5.根据权利要求3所述的系统,其中,所述映射模块基于CNN神经网络和残差网络构成。


6.一种意图识别方法,应用于意图识别系统,所述意图识别系统包括顺序连接...

【专利技术属性】
技术研发人员:曹家波
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1