【技术实现步骤摘要】
工单描述生成方法、装置、电子设备及可读存储介质
本申请涉及自然语言处理
,具体而言,涉及一种工单描述生成方法、装置、电子设备及可读存储介质。
技术介绍
近年来,随着互联网技术的广泛应用,在线客服日益普及,企业可以通过在线客服满足用户的咨询、购买、投诉等需求,当用户与客服在线进行交流时,客服需要对用户反馈的信息进行信息提炼以生成工单描述,工单描述要求简洁明了且概括了用户反馈的所有信息,能够保证企业可以根据工单描述对用户反馈的信息快速做出反应。但是,信息提炼本身就是一件较为复杂的工作,客服做大量重复的信息提炼工作还会使工单描述的准确性无法得到保证,对客服而言,人工对用户反馈的信息进行信息提炼需要花费大量的时间,并且效率低下。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种工单描述生成方法、装置、电子设备及可读存储介质,能够准确快速地生成工单描述。第一方面,本申请实施例提供了一种工单描述生成方法,所述方法包括:构建包括生成模型和判别模型的生成对抗网络;获得历史工单和人工工单描述作为 ...
【技术保护点】
1.一种工单描述生成方法,其特征在于,所述方法包括:/n构建包括生成模型和判别模型的生成对抗网络;/n获得历史工单和人工工单描述作为训练样本,对所述生成对抗网络进行训练,以基于所述生成模型得到最优生成模型;/n基于所述最优生成模型和待处理工单,生成所述待处理工单对应的工单描述。/n
【技术特征摘要】
1.一种工单描述生成方法,其特征在于,所述方法包括:
构建包括生成模型和判别模型的生成对抗网络;
获得历史工单和人工工单描述作为训练样本,对所述生成对抗网络进行训练,以基于所述生成模型得到最优生成模型;
基于所述最优生成模型和待处理工单,生成所述待处理工单对应的工单描述。
2.根据权利要求1所述的方法,其特征在于,所述对所述生成对抗网络进行训练,以基于所述生成模型得到最优生成模型的步骤,包括:
将所述历史工单输入所述生成模型得到历史工单描述;
将所述历史工单描述和所述人工工单描述输入所述判别模型,得到所述判别模型的输出概率值;
利用所述判别模型的输出概率值对所述判别模型进行反向调节,得到最优判别模型;
固定所述最优判别模型的参数,基于所述历史工单、生成模型和最优判别模型,得到所述最优判别模型的输出概率值;
利用所述最优判别模型的输出概率值对所述生成模型进行反向调节,得到最优生成模型。
3.根据权利要求2所述的方法,其特征在于,所述生成模型包括编码器和解码器,所述将所述历史工单输入所述生成模型得到历史工单描述的步骤,包括:
对所述历史工单进行分词,并基于预设词向量库将所述历史工单转换为词向量序列;
将所述词向量序列输入所述生成模型,利用所述生成模型的编码器对所述词向量序列进行编码,得到所述编码器每个节点的编码隐层状态;
基于注意力机制,利用所述解码器对所述编码器最后一个节点的编码隐层状态进行解码,得到历史工单描述。
4.根据权利要求3所述的方法,其特征在于,所述基于注意力机制,利用所述解码器对所述编码器最后一个节点的编码隐层状态进行解码,得到历史工单描述的步骤,包括:
利用所述解码器对所述编码器最后一个节点的编码隐层状态进行解码,得到所述解码器每个节点的解码隐层状态;
计算所述解码器当前节点的解码隐层状态与每个编码隐层状态的归一化相似度;
通过每个编码隐层状态及其对应归一化相似度,得到所述解码器当前节点的中间语义向量;
根据所述解码器当前节点的中间语义向量、当前节点的解码隐层状态、以及前一节点的文本向量,得到所述解码器当前节点对应的文本向量;
重复上述过程,依据所述解码器每个节点对应的文本向量,得到历史工单描述。
5.根据权利要求3所述的方法,其特征在于,所述生成模型包括序列到序列模型,所述编码器包括双向门控循环单元,所述解码器包括基于注意力机制的门控循环单元。
6.根据权利要求2所述的方法,其特征在于,所述判别模型包括特征提取网络和分类网络;
所述将所述历史工单描述和所述人工工单描述输入所述判别模型,得到所述判别模型的输出概率值的步骤,包括:
将所述历史工单描述和所述人工工单描述经过相同的预处理得到对应的工单描述向量;
将所述工单描述向量输入所述判别模型,利用所述特征提取网络对所述工单描述向量进行特征提取,得到文本特征;
利用所述分类网络对所述文本特征进行分类,得到所述判别模型的输出概率值。
7.根据权利要求6所述的方法,其特征在于,所述特征提取网络包括至少一层卷积层,所述分类网络包括至少一层全连接层。
8.根据权利要求2所述的方法,其特征在于,所述利用所述判别模型的输出概率值对所述判别模型进行反向调节,得到最优判别模型的步骤,包括:
分别获取所述历史工单描述和所述人工工单描述对应的标签;
依据所述判别模型的输出概率值、以及所述历史工单描述和所述人工工单描述对应的标签,计算出所述判别模型的损失函数值;
依据所述判别模型的损失函数值及输出概率值,利用反向传播算法更新所述判别模型的参数,得到最优判别模型。
9.根据权利要求2所述的方法,其特征在于,所述固定所述最优判别模型的参数,基于所述历史工单、生成模型和最优判别模型,得到所述最优判别模型的输出概率值的步骤,包括:
固定所述最优判别模型的参数,将所述历史工单输入所述生成模型得到历史工单描述;
将所述历史工单描述输入所述最优判别模型,得到所述最优判别模型的输出概率值。
10.根据权利要求2所述的方法,其特征在于,所述利用所述最优判别模型的输出概率值对所述生成模型进行反向调节,得到最优生成模型的步骤,包括:
获取所述历史工单描述对应的标签;
依据所述最优判别模型的输出概率值、以及所述历史工单描述对应的标签,计算出所述最优判别模型的奖励值;
依据所述最优判别模型的奖励值,利用策略梯度算法更新所述生成模型的参数,直至所述最优判别模型的输出概率值逼近所述历史工单描述对应的标签,得到最优生成模型。
11.根据权利要求1所述的方法,其特征在于,所述最优生成模型包括编码器和解码器,所述基于所述最优生成模型和待处理工单,生成所述待处理工单对应的工单描述的步骤,包括:
对所述待处理工单进行分词,并基于预设词向量库将所述待处理工单转换为词向量序列;
将所述词向量序列输入所述所述最优生成模型,利用所述最优生成模型的编码器对所述词向量序列进行编码,得到隐层状态序列;
基于注意力机制,利用所述最优生成模型的解码器对所述编码器的输出进行解码,得到工单描述。
12.一种工单描述生成装置,其特征在于,所述装置包括:
构建模块,用于构建包括生成模型和判别模型的生成对抗网络;
训练模块,用于获得历史工单和人工工单描述作为训练样本,对所述生成对抗网络...
【专利技术属性】
技术研发人员:宋振秋,卫万成,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。