【技术实现步骤摘要】
一种多轮对话改写方法和装置
本专利技术涉及深度学习
,特别是涉及一种多轮对话改写方法和一种多轮对话改写装置。
技术介绍
伴随着深度学习和大数据技术的发展,开放域人机对话系统已经是人工智能领域的一项重要研究工作,并已经在智能客服、聊天机器人、虚拟助手等方面得到了广泛应用。根据人机交互的轮数,开放域对话系统分为:单轮开放域对话系统和多轮开放域对话系统。通过海量单轮的社交对话数据和基于深度学习的检索式或者生成式的建模方法,单轮开放领域对话系统已经产生了一些不错的效果;但是,在多轮对话系统中,一般只有对话的2个人,为了交流的简洁、流畅和高效性,通常会根据上下文做一些省略或者指代的说法,所以不能直接套用单轮对话系统的做法,例如:“你最喜欢什么电影?”“泰坦尼克号。”“为什么?”如果是补全的语义对话应该是这样的:“你最喜欢什么电影?”“我最喜欢的电影是泰坦尼克号。”“为什么你最喜欢的电影是泰坦尼克号?”由于多轮对话系统中存在普遍的对话语义的缺失、省略、指代等不完整性, ...
【技术保护点】
1.一种多轮对话改写方法,其特征在于,包括:/n获取目标多轮对话改写模型,待改写对话以及所述待改写对话对应的历史对话;/n将所述待改写对话和所述历史对话输入至所述目标多轮对话改写模型,以通过所述目标多轮对话改写模型预测所述待改写对话中每个序列对应的序列标签,并根据所述序列标签对所述待改写对话进行改写得到目标对话。/n
【技术特征摘要】
1.一种多轮对话改写方法,其特征在于,包括:
获取目标多轮对话改写模型,待改写对话以及所述待改写对话对应的历史对话;
将所述待改写对话和所述历史对话输入至所述目标多轮对话改写模型,以通过所述目标多轮对话改写模型预测所述待改写对话中每个序列对应的序列标签,并根据所述序列标签对所述待改写对话进行改写得到目标对话。
2.根据权利要求1所述的方法,其特征在于,所述序列标签包括删除标签,替换标签和保留标签,所述根据所述序列标签对所述待改写对话进行改写得到目标对话,包括:
删除所述删除标签对应的序列,保留所述保留标签对应的序列,并针对所述替换标签对应的序列生成替换,得到目标对话。
3.根据权利要求1或2所述的方法,其特征在于,在所述步骤获取目标多轮对话改写模型,待改写对话以及所述待改写对话对应的历史对话之前,还包括:
获取原始训练数据;
对所述原始训练数据进行标注得到具备标签的目标训练数据;
根据所述目标训练数据对初始多轮对话改写模型进行训练,得到所述目标多轮对话改写模型。
4.根据所述权利要求3所述的方法,其特征在于,所述根据所述目标训练数据对初始多轮对话改写模型进行训练,得到所述目标多轮对话改写模型,包括:
对所述目标训练数据进行编码得到编码数据,所述编码数据包含历史句子的编码信息和当前改写句子的编码信息;
根据所述当前改写句子的编码信息学习得到所述当前改写句子中每个序列对应的的序列标签,并计算得到学习标签的第一损失值;
根据所述序列标签和所述编码数据,对所述当前改写句子进行解码得到改写后的句子,并计算得到编码的第二损失值;
根据所述第一损失值和所述第二损失值,更新所述原始多轮对话改写模型的参数,得到所述目标多轮对话改写模型。
5.根据权利要求3所述的方法,其特征在于,所述根据所述序列标签和所述编码数据,对所述当前改写句子进行解码得到改写后的...
【专利技术属性】
技术研发人员:李锋,邹武合,张伟东,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。