【技术实现步骤摘要】
一种基于多轮对话的智能客服方法及系统
[0001]本专利技术涉及人工智能及自然语言处理
,尤其涉及一种基于多轮对话的智能客服方法及系统。
技术介绍
[0002]随着人工智能、大数据、物联网等新兴技术的发展,一些大型企业越来越重视实现智能化、便捷化的管理。智能客服机器人引入办公环境中虽然帮助员工大大提高了处理日常事务的效率,但是现在的客服机器人的任务设定较为简单,大多只具备问答功能而非对话功能,不能完全满足办公系统的需求。后来多轮对话被大量运用于智能客服的应用中,当机器无法准确解析用户的意图时,通过反向询问明确用户的意图,使用尽可能少的对话轮数帮助用户找到满意的信息或服务。
[0003]目前像智慧办公等特殊领域的数据集相对较少,语言的多样性又容易导致理解产生歧义。现在开放的预训练模型(BERT、ERNIE等)缺乏该领域的相关特征,结合该领域的多轮对话数据集,再次进行预训练能够显著的提升对话系统的性能。而如何实现对往轮对话信息的深度挖掘和高效利用是设计一个智能的、表现良好的面向特殊领域的多轮对话系统急需解决的问题。 ...
【技术保护点】
【技术特征摘要】
1.一种基于多轮对话的智能客服方法,其特征在于,包括以下步骤:S1、构建知识库,进行数据预处理;S2、搭建训练网络,根据预处理的数据集,进行EBTA模型训练;S3、获取用户输入问题,进行意图识别分类;S4、对话交互收集用户需求;S5、明确用户指令并执行任务。2.根据权利要求1所述的方法,其特征在于,步骤S1中,构建的知识库,包括基础知识库,行业知识库;行业知识库存储行业知识,通过爬虫的方式对网络资料进行爬取获取;基于用户与客服之间的历史对话数据更新扩充行业知识库;基础知识库来自ERNIE自有的语料库,存储常用问答,在此基础上额外增加行业知识库训练语料,扩充训练数据集。3.根据权利要求1所述的方法,其特征在于,步骤S1中,对问答对进行数据预处理:字母全部小写处理;去除包括标点符号在内的特殊符号;使用停用词表去除掉会影响分类结果的停用词。4.根据权利要求1所述的方法,其特征在于,步骤S2中,EBTA(ERNIE
‑
BiLSTM
‑
TextCNN
‑
Attention)模型用于意图识别和槽位填充,包括输入层、预训练ERNIE模型层、BT特征提取层、注意力机制层、全连接层和输出层;输入层给定输入句子S=(w1,w2,
…
,w
N
),其中w
i
表示每一个中文汉字,N代表句子长度;句中每个字通过one
‑
hot编码为输入向量X=(x1,x2,
…
,x
N
);输入到预先训练好的ERNIE模型得到词向量E=(e1,e2,
…
,e
N
);ERNIE最后一层的输出作为H=(h1,h2,
…
,h
N
)作为BT特征提取层BiLSTM模型和TextCNN模型的输入;预训练ERNIE模型层,采用双向Transformer编码器进行编码,以词语为单位的掩盖训练,编码更多的语义信息,提取字与字、词与词之间的特征信息,解析中文文本并且学习文本中上下文表达的语义信息;BT特征提取层使用BiLSTM模型和TextCNN模型,双向长短期记忆网络(BiLSTM)是由一个正向处理序列的LSTM和一个反向处理序列的LSTM组成,对输入的上下文信息进行深层次特征提取;卷积神经网络CNN用来获取局部特征信息。5.根据权利要求4所述的方法,其特征在于,在步骤S2中,将步骤S1得到的问答数据集载入构建的网络中,并加载模型EBTA,训练针对智慧办公领域的新模型,获得最佳配置参数;使用ERNIE模型对文本进行向量化处理,将预训练得到的文本特征表示分别输入BiLSTM模...
【专利技术属性】
技术研发人员:杨彤,李雪,魏子重,段强,姜凯,
申请(专利权)人:山东浪潮科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。