一种基于对比学习区分对话摘要与对话者的方法技术

技术编号：37850047 阅读：11 留言：0更新日期：2023-06-14 22:37

本发明专利技术提供一种基于对比学习区分对话摘要与对话者的方法，其特征在于，首先基于BART构建增强序列到序列的神经网络模型，该神经网络模型的编码器

全部详细技术资料下载

【技术实现步骤摘要】
一种基于对比学习区分对话摘要与对话者的方法

[0001]本专利技术属于深度学习和自然语言处理领域，具体涉及一种基于对比学习区分对话摘要与对话者的方法。

技术介绍

[0002]随着预训练技术的发展，预训练语言模型(如BART)在诸多自然语言处理生成任务上取得了突出的性能。对于对话摘要任务，多轮对话被拼接为平滑文本输入预训练模型。然而，由于与预训练目标(如BART的降噪生成)的差异，预训练模型处理对话数据的性能并不理想。根据人工统计，在对话摘要数据集SAMsum中，对于多人参与的对话，BART生成的摘要中有50％有事实一致性错误，其中68.4％的事实一致性错误直接与无法识别对话者相关。
[0003]目前对话摘要领域主要有两种技术路线：(1)层级网络，整段对话被分为词、轮、整体等多种粒度被分别编码，这种方法可以捕捉到对话的结构信息，但是无法利用预训练模型的参数；(2)预训练模型，这种方法将对话拼接并视为平整文本，并利用其他方法来辅助摘要的生成，但是这类方法难以捕捉到对话的结构信息，从而难以识别对话中的对话者。而先前也没有增强预训练模型识别对话者的相关工作。

技术实现思路

[0004]为解决上述问题，提供一种区分对话摘要与对话者的方法，本专利技术采用了如下技术方案：
[0005]本专利技术提供了一种基于对比学习区分对话摘要与对话者的方法，其特征在于，包括以下步骤：步骤S1，基于BART构建序列到序列的神经网络模型；步骤S2，将训练用对话输入至神经网络模型以生成训练用对话摘要，并计算训练用对话摘...

【技术保护点】

【技术特征摘要】
1.一种基于对比学习区分对话摘要与对话者的方法，其特征在于，包括以下步骤：步骤S1，基于BART构建序列到序列的神经网络模型；步骤S2，将训练用对话输入至所述神经网络模型以生成训练用对话摘要，并计算所述训练用对话摘要与目标摘要的交叉熵损失；步骤S3，采用三种对比学习任务辅助所述神经网络模型对所述训练用对话进行对话编码，并计算所述三种对比学习任务的对比学习损失；步骤S4，基于总体训练损失对所述神经网络模型进行训练直至生成训练好的神经网络模型，将其作为对话者区分模型；步骤S5，将待测对话输入至所述对话者区分模型获取与所述待测对话对应的对话摘要。2.根据权利要求1所述的一种基于对比学习区分对话摘要与对话者的方法，其特征在于：其中，所述三种对比学习任务分别为词级别对比学习、轮级别对比学习以及对话者级别对比学习。3.根据权利要求2所述的一种基于对比学习区分对话摘要与对话者的方法，其特征在于：其中，所述词级别对比学习为：所述神经网络模型在对所述训练用对话进行编码时拉近所述训练用对话中的同一对话者的词表示，拉远所述训练用对话中的不同对话者的词表示，所述轮级...

【专利技术属性】
技术研发人员：邱锡鹏，耿志超，周雅倩，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人