对话数据生成方法和装置、电子设备及存储介质制造方法及图纸

技术编号：43576987 阅读：14 留言：0更新日期：2024-12-06 17:43

本申请实施例提供了一种对话数据生成方法和装置、电子设备及存储介质，属于金融科技技术领域。该方法包括：获取具有金融领域知识的目标文本；对目标文本进行文本分割，得到多个文本段落；针对每个文本段落，对文本段落进行摘要生成，得到文本段落的目标摘要，并将目标摘要确定为对话回复；通过预设的对话生成模型对对话回复进行问题生成，得到对话回复对应的目标问题；基于对话回复和目标问题，构建初步对话数据；对初步对话数据进行数据增强，得到目标对话数据，对话数据用于作为样本数据对预设的交互对话模型进行训练。本申请实施例能够高效、快捷地扩充用于训练交互对话模型的对话数据的数据量。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及金融科技，尤其涉及一种对话数据生成方法和装置、电子设备及存储介质。

技术介绍

1、目前，在各种金融业务领域中，常常会引入对话机器人来实现人机交互对话，其中，对话机器人的交互操作常常是依赖于训练出的交互对话模型进行的。

2、为了提高对话质量，常常需要大量的高质量标注数据来训练上述的交互对话模型，而现实中能获取到的高质量标注数据的数据较为有限，会影响到模型的训练效果。对此，相关技术中常常是采用人工构造的方式制作标注数据，这一方式虽然可以在一定程度上缓解用于训练模型的对话数据的不足，但仍存在对话数据的生成效率不高的问题。

技术实现思路

1、本申请实施例的主要目的在于提出一种对话数据生成方法和装置、电子设备及存储介质，旨在高效、快捷地扩充用于训练交互对话模型的对话数据的数据量。

2、为实现上述目的，本申请实施例的第一方面提出了一种对话数据生成方法，所述方法包括：

3、获取具有金融领域知识的目标文本；

4、对所述目标文本进行文本分割，得到多个文本段落；

<本文档来自技高网...

【技术保护点】

1.一种对话数据生成方法，其特征在于，所述对话数据生成方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述目标文本进行文本分割，得到多个文本段落，包括：

3.根据权利要求1所述的方法，其特征在于，所述针对每个所述文本段落，对所述文本段落进行摘要生成，得到所述文本段落的目标摘要，包括：

4.根据权利要求1所述的方法，其特征在于，所述通过预设的对话生成模型对所述对话回复进行问题生成，得到所述对话回复对应的目标问题，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述初步对话数据进行数据增强，得到目标对话数据，包括：

<...

【技术特征摘要】

1.一种对话数据生成方法，其特征在于，所述对话数据生成方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述目标文本进行文本分割，得到多个文本段落，包括：

3.根据权利要求1所述的方法，其特征在于，所述针对每个所述文本段落，对所述文本段落进行摘要生成，得到所述文本段落的目标摘要，包括：

4.根据权利要求1所述的方法，其特征在于，所述通过预设的对话生成模型对所述对话回复进行问题生成，得到所述对话回复对应的目标问题，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述初步对话数据进行数据增强，得到目标对话数据，包括：

6.根据权利要求1所述的方法，其...

【专利技术属性】
技术研发人员：唐小初，冉俊豪，舒畅，陈又新，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人