【技术实现步骤摘要】
一种基于知识融合的客服多级意图识别方法
[0001]本专利技术涉及自然语言的文本分类
,具体涉及一种基于知识融合的客服多级意图识别方法。
技术介绍
[0002]互联网的快速发展也带动了人工智能的快速发展,随着运营商规模的扩大与成熟,用户的基数增多,带来业务数量与问题的增加,有限的客服人员无法及时解决所有用户问题,难以提供优质的服务,利用人工智能相关技术解决该问题是市场趋势,数智化客服已经成为未来演进发展的重点方向。同时,意图识别本质上是一种分类问题,一方面分类所需数据需要经过人工筛选和标注方可使用,对数据质量存在一定要求;另一方面对于一条文本对应多个类别,并且类别间具有级联关系的任务,直接利用分类模型结果并不理想,根本原因就是在实际应用场景中,用户口语随机,上下文语境复杂,中间夹杂着很多无效甚至干扰信息,这些造成用户语义模糊,导致意图识别准确率不高。为此,提出一种基于知识融合的客服多级意图识别方法。
技术实现思路
[0003]本专利技术所要解决的技术问题在于:如何解决运营商客服领域文本口语短、语法不规范 ...
【技术保护点】
【技术特征摘要】
1.一种基于知识融合的客服多级意图识别方法,其特征在于,包括以下步骤:S1:知识库构建从语料库提取出标准问,根据标准问通过多组的Transformer进行数据扩增生成相似问,进而得到标准问知识库;S2:知识融合在文本向量的基础上融入标准问知识库向量,即将知识库中的标准问作为特征融入用户输入问题中,然后组成联合特征向量一起输入到知识融合模型;S3:多意图识别知识融合模型通过学习不同层类目和文本之间的关系,在预测时根据父类的预测结果来预测最终的子类,进行自顶向下的层次分类,通过聚合不同层的预测结果来得到最终的预测结果。2.根据权利要求1所述的一种基于知识融合的客服多级意图识别方法,其特征在于:在所述步骤S1中,具体过程如下:S11:从语料库中抽取一组标准问分别记为sentence1和sentence2,添加[CLS]符号作为文本的开始位置,对两句话用一个[SEP]符号作区分,同时添加句尾表示结束位置,将数据转化成[CLS]sentencel[SEP]sentence2[SEP]的形式;S12:然后根据sentence1去预测sentence2,进行一个相似句的生成任务;S13:经过多个问句对的训练后,输入句子将生成语义相似的相似问,进而得到标准问知识库。3.根据权利要求1所述的一种基于知识融合的客服多级意图识别方法,其特征在于:在所述步骤S2中,文本向量的获取及处理过程具体如下:S201:对于用户文本Q={q1,q2,
…
,q
n
},其对应的层级标签结构为Y={y1,y2,
…
,y
h
},其中,q
n
表示文本Q中的第n个句子,h表示标签的层级数量,y
i
表示第i层标签的集合;S202:用户文本通过嵌入层Embedding得到文本的词向量输入到Bi
‑
GRU模型,通过Bi
‑
GRU模型分别得到两个不同时刻的上下文表示:GRU模型分别得到两个不同时刻的上下文表示:GRU模型分别得到两个不同时刻的上下文表示:其中,分别表示第i个不同方向下GRU得到的上下文表征,表示对不同方向下得到的上下文表征进行拼接,表示不同方向的上一次的隐层状态,concat(
·
)表示对两个向量进行拼接,与表示GRU模型内部结构不变,输入文本的方向不同。4.根据权利要求3所述的一种基于知识融合的客服多级意图识别方法,其特征在于:在所述步骤S202中,GRU模型函数为:z
i
=σ(W
z
·
[h
i
‑1,E
qi
])r
i
=σ(W
r
·
[h
i
‑1,E
qi
)
其中,z
i
表示输入门神经元得到的向量,r
i
表示重置门神经元得到的向量,表示记忆门神经元得到的向量,h
i
表示向量的记忆状态,σ表示si...
【专利技术属性】
技术研发人员:李飞,赵廷芳,冯强中,范文斌,丁常坤,王颜颜,周源,程磊,冯影,
申请(专利权)人:科大国创云网科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。