多轮对话模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：43673565 阅读：18 留言：0更新日期：2024-12-18 20:58

本申请提供一种多轮对话模型的训练方法、装置、电子设备及存储介质，涉及人工智能技术领域。在本申请中，通过构建带有用于指示对应的样本对话语句是否需要改写的第一标签的样本对话训练集，对初始多轮对话模型进行迭代训练；这样避免了现有技术中无监督的方式判别当前对话语句是否需要改写，导致判别模型的判别准确性较低的问题。并且，由于初始多轮对话模型既可以判别当前对话语句是否需要改写，还可以在确定需要改写当前对话语句时，基于当前对话语句关联的至少一个历史对话语句对当前对话语句进行改写，实现了语句判别和语句改写的联合建模，也即针对初始多轮对话模型的判别和改写均进行了训练，从而提高了多轮对话模型的对话改写效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种多轮对话模型的训练方法、装置、电子设备及存储介质。

技术介绍

1、随着深度学习和大数据技术的发展，人机对话系统已经是人工智能领域的一项重要研究工作，并已经在智能客服、聊天机器人、智能助手等方面得到了广泛应用。其中，根据人机交互的轮数，人机对话系统可以分为：多轮对话系统和单轮对话系统。

2、在多轮对话系统中，为了交流的简洁和高效性，对话中通常会出现指代和/或省略的情况，例如，对于前面轮次的对话语句中出现过的对象名称，在当前轮次的对话语句中可能会选用人称进行指代；又例如，对于前面轮次的对话语句中出现过的目标实体(如，某一地点)，在当前轮次的对话语句中可能会进行省略。此时，通常需要结合前面轮次的对话语句信息，才能明确当前轮次对话语句的语义信息，从而对当前轮次的对话内容进行答复。

3、由此可见，如果上述多轮对话中会出现省略和指代的情况，可能会影响机器对语言的理解，最终导致多轮对话的效果欠佳。因此，为了提高机器对语言的理解，需要对存在省略和/或指代的对话语句进行指代消解和/或省略补全。>

4、示例性的本文档来自技高网...

【技术保护点】

1.一种多轮对话模型的训练方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述构建样本对话训练集，包括：

3.如权利要求1所述的方法，其特征在于，所述基于所述样本对话训练集对初始多轮对话模型进行对次迭代训练，包括：

4.如权利要求3所述的方法，其特征在于，所述基于所述第二样本对话语句关联的至少一个历史对话语句改写所述第二样本对话语，包括：

5.如权利要求3所述的方法，其特征在于，所述确定改写后的第二样本对话语句和所述第二样本对话语句对应的标准对话语句之间的第二损失值，包括：

6.如权利要求3-5中任一项所述的方...

【技术特征摘要】

1.一种多轮对话模型的训练方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述构建样本对话训练集，包括：

3.如权利要求1所述的方法，其特征在于，所述基于所述样本对话训练集对初始多轮对话模型进行对次迭代训练，包括：

4.如权利要求3所述的方法，其特征在于，所述基于所述第二样本对话语句关联的至少一个历史对话语句改写所述第二样本对话语，包括：

5.如权利要求3所述的方法，其特征在于，所述确定改写后的第二样本对话语句和所述第二样本对话语句对应...

【专利技术属性】
技术研发人员：徐启东，杨青，
申请(专利权)人：度小满科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人