基于文本数据训练生成对抗网络的方法及装置制造方法及图纸

技术编号：38422643 阅读：6 留言：0更新日期：2023-08-07 11:22

本公开提供了一种基于文本数据训练生成对抗网络的方法及装置，该方法包括：通过第一代生成器对每个文本数据进行识别处理，生成文本数据集合对应的目标文本数据集合；将目标文本数据集合中每个目标文本数据输入到第一代判别器，并通过第一代判别器对每个目标文本数据进行判别处理，得到每个目标文本数据是否包含有害内容的评分；根据每个目标文本数据是否包含有害内容的评分，确定目标文本数据集合中目标文本数据包含有害内容的有害率；以目标文本数据集合中目标文本数据包含有害内容的有害率作为第一代生成器的生成奖励得分，通过强化学习算法对第一代生成器进行强化学习训练。本公开技术方案可以提升生成器识别有害内容的能力。的能力。的能力。

全部详细技术资料下载

【技术实现步骤摘要】
基于文本数据训练生成对抗网络的方法及装置

[0001]本公开涉及数据处理
，尤其涉及一种基于文本数据训练生成对抗网络的方法及装置。

技术介绍

[0002]目前，随着人工智能技术的不断发展，语言模型在自然语言处理领域得到了广泛的应用。然而，现在的语言模型识别有害内容的能力较差，在生成文本时，语言模型可能会涉及一些有害的内容，例如攻击性内容、隐私内容、涉及黄赌毒内容等。这些有害内容会对人们造成不良影响，甚至会引发社会问题和法律纠纷。因此，如何避免或减少语言模型生成的有害内容就成为了当前研究的热点问题。

技术实现思路

[0003]有鉴于此，本公开实施例提供了一种基于文本数据训练生成对抗网络的方法、装置、电子设备及计算机可读存储介质，以解决现有技术因语言模型识别有害内容的能力较差导致在生成文本时可能会包含有害内容的技术问题。
[0004]本公开实施例的第一方面，提供了一种基于文本数据训练生成对抗网络的方法，该生成对抗网络包括第一代生成器和第一代判别器，该方法包括：获取用于训练第一代生成器的文本数据集合；将文本数据集合中的每个文本数据输入到第一代生成器，并通过第一代生成器对每个文本数据进行识别处理，生成文本数据集合对应的目标文本数据集合；将目标文本数据集合中每个目标文本数据输入到第一代判别器，并通过第一代判别器对每个目标文本数据进行判别处理，得到每个目标文本数据是否包含有害内容的评分；根据每个目标文本数据是否包含有害内容的评分，确定目标文本数据集合中目标文本数据包含有害内容的有害率；以目标文本数据...

【技术保护点】

【技术特征摘要】
1.一种基于文本数据训练生成对抗网络的方法，其特征在于，所述生成对抗网络包括第一代生成器和第一代判别器，所述方法包括：获取用于训练所述第一代生成器的文本数据集合；将所述文本数据集合中的每个文本数据输入到所述第一代生成器，并通过所述第一代生成器对每个文本数据进行识别处理，生成所述文本数据集合对应的目标文本数据集合；将所述目标文本数据集合中每个目标文本数据输入到所述第一代判别器，并通过所述第一代判别器对每个目标文本数据进行判别处理，得到每个目标文本数据是否包含有害内容的评分；根据每个目标文本数据是否包含有害内容的评分，确定所述目标文本数据集合中目标文本数据包含有害内容的有害率；以所述目标文本数据集合中目标文本数据包含有害内容的有害率作为所述第一代生成器的生成奖励得分，通过强化学习算法对所述第一代生成器进行强化学习训练；循环上述步骤，直至所述第一代生成器收敛停止训练，得到目标生成器。2.根据权利要求1所述的方法，其特征在于，在将所述目标文本数据集合中每个目标文本数据输入到所述第一代判别器之前，所述方法包括：获取用于训练判别器的标注文本数据，所述标注文本数据包括通过所述第一代生成器获取的有害文本数据和无害文本数据；将所述有害文本数据和所述无害文本数据输入到所述判别器，并通过所述判别器分别判断所述有害文本数据和所述无害文本数据是否包含有害内容，得到所述有害文本数据是否包含有害内容的评分和所述无害文本数据是否包好有害内容的评分；当所述有害文本数据是否包含有害内容的评分和所述无害文本数据是否包好有害内容的评分分别满足初始预设条件时，停止训练，得到所述第一代判别器。3.根据权利要求2所述的方法，其特征在于，在所述第一代生成器收敛之后，所述方法还包括：获取用于训练所述第一代判别器的文本数据集合；将用于训练所述第一代判别器的文本数据集合中的每个文本数据输入到所述目标生成器，并通过所述目标生成器对用于训练所述第一代判别器的文本数据集合中的每个文本数据进行识别处理，生成用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合；将用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据输入到所述第一代判别器，并通过所述第一代判别器判断用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据是否包含有害内容，得到用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据是否包含有害内容的评分；当用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据是否包含有害内容的评分满足目标预设条件时，停止训练，得到目标判别器。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取待识别的文本数据；将所述待识别的文本数据输入到所述目标生成器，通过所述目标生成器对所述待识别
的文本数据进行识别处理，生成所述待识别的文本数据对应的目标文本数据；基于预设过滤规则，对所述待识别的文本数据对应的目标文本数据进行过滤处理，确定所述待识别的文本数据对应的目标文本数据是否包含有害内容，所述预设过滤规则包括基于正则表达式设置的过滤规则、基于硬匹配方式设置的过滤规则、以及基于软匹配方式设置的过滤规则。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：获取待识别的文本数据；将所述待识别的文本数据输入到所...

【专利技术属性】
技术研发人员：暴宇健，王芳，
申请(专利权)人：深圳须弥云图空间科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人