基于文本数据训练生成对抗网络的方法及装置制造方法及图纸

技术编号:38422643 阅读:6 留言:0更新日期:2023-08-07 11:22
本公开提供了一种基于文本数据训练生成对抗网络的方法及装置,该方法包括:通过第一代生成器对每个文本数据进行识别处理,生成文本数据集合对应的目标文本数据集合;将目标文本数据集合中每个目标文本数据输入到第一代判别器,并通过第一代判别器对每个目标文本数据进行判别处理,得到每个目标文本数据是否包含有害内容的评分;根据每个目标文本数据是否包含有害内容的评分,确定目标文本数据集合中目标文本数据包含有害内容的有害率;以目标文本数据集合中目标文本数据包含有害内容的有害率作为第一代生成器的生成奖励得分,通过强化学习算法对第一代生成器进行强化学习训练。本公开技术方案可以提升生成器识别有害内容的能力。的能力。的能力。

【技术实现步骤摘要】
基于文本数据训练生成对抗网络的方法及装置


[0001]本公开涉及数据处理
,尤其涉及一种基于文本数据训练生成对抗网络的方法及装置。

技术介绍

[0002]目前,随着人工智能技术的不断发展,语言模型在自然语言处理领域得到了广泛的应用。然而,现在的语言模型识别有害内容的能力较差,在生成文本时,语言模型可能会涉及一些有害的内容,例如攻击性内容、隐私内容、涉及黄赌毒内容等。这些有害内容会对人们造成不良影响,甚至会引发社会问题和法律纠纷。因此,如何避免或减少语言模型生成的有害内容就成为了当前研究的热点问题。

技术实现思路

[0003]有鉴于此,本公开实施例提供了一种基于文本数据训练生成对抗网络的方法、装置、电子设备及计算机可读存储介质,以解决现有技术因语言模型识别有害内容的能力较差导致在生成文本时可能会包含有害内容的技术问题。
[0004]本公开实施例的第一方面,提供了一种基于文本数据训练生成对抗网络的方法,该生成对抗网络包括第一代生成器和第一代判别器,该方法包括:获取用于训练第一代生成器的文本数据集合;将文本数据集合中的每个文本数据输入到第一代生成器,并通过第一代生成器对每个文本数据进行识别处理,生成文本数据集合对应的目标文本数据集合;将目标文本数据集合中每个目标文本数据输入到第一代判别器,并通过第一代判别器对每个目标文本数据进行判别处理,得到每个目标文本数据是否包含有害内容的评分;根据每个目标文本数据是否包含有害内容的评分,确定目标文本数据集合中目标文本数据包含有害内容的有害率;以目标文本数据集合中目标文本数据包含有害内容的有害率作为第一代生成器的生成奖励得分,通过强化学习算法对第一代生成器进行强化学习训练,循环上述步骤,直至第一代生成器收敛停止训练,得到目标生成器。
[0005]本公开实施例的第二方面,提供了一种基于文本数据训练生成对抗网络的装置,该生成对抗网络包括第一代生成器和第一代判别器,该装置包括:获取模块,用于获取用于训练第一代生成器的文本数据集合;识别处理模块,用于将文本数据集合中的每个文本数据输入到第一代生成器,并通过第一代生成器对每个文本数据进行识别处理,生成文本数据集合对应的目标文本数据集合;判别处理模块,用于将目标文本数据集合中每个目标文本数据输入到第一代判别器,并通过第一代判别器对每个目标文本数据进行判别处理,得到每个目标文本数据是否包含有害内容的评分;确定模块,用于根据每个目标文本数据是否包含有害内容的评分,确定目标文本数据集合中目标文本数据包含有害内容的有害率;训练模块,用于以目标文本数据集合中目标文本数据包含有害内容的有害率作为第一代生成器的生成奖励得分,通过强化学习算法对第一代生成器进行强化学习训练;循环模块,用于循环上述步骤,直至第一代生成器收敛停止训练,得到目标生成器。
[0006]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0007]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0008]本公开实施例与现有技术相比存在的有益效果是:获取用于训练第一代生成器的文本数据集合,将文本数据集合中的每个文本数据输入到第一代生成器,并通过第一代生成器对每个文本数据进行识别处理,生成文本数据集合对应的目标文本数据集合,然后将目标文本数据集合中每个目标文本数据输入到第一代判别器,并通过第一代判别器对每个目标文本数据进行判别处理,得到每个目标文本数据是否包含有害内容的评分,根据每个目标文本数据是否包含有害内容的评分可以确定目标文本数据集合中目标文本数据包含有害内容的有害率,这样以目标文本数据集合中目标文本数据包含有害内容的有害率作为第一代生成器的生成奖励得分,通过强化学习算法对第一代生成器进行强化学习训练,循环上述步骤,直至第一代生成器收敛停止训练,得到目标生成器,以此方式得到的目标生成器识别有害内容的能力更强,有效地避免了在基于目标生成器生成文本时出现包含有害内容的文本数据。
附图说明
[0009]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0010]图1示出了可以应用本专利技术实施例的技术方案的示例性系统架构的示意图;图2是本公开实施例提供的一种基于文本数据训练生成对抗网络的方法的流程示意图;图3是本公开实施例提供的另一种基于文本数据训练生成对抗网络的方法的流程示意图;图4是本公开实施例提供的又一种基于文本数据训练生成对抗网络的方法的流程示意图;图5是本公开实施例提供的一种基于文本数据训练生成对抗网络的装置的结构示意图;图6是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0011]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0012]需要说明的是,本公开所涉及的用户信息(包括但不限于终端设备信息、用户个人
信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
[0013]相关技术中,大语言模型在自然语言处理的各个领域都有着广泛的应用,其通过对海量语料的学习和建模,能够提取出文本的内在规律和语义信息,从而实现自然语言的各种应用,目前的使用场景如下:1、语言生成任务:大语言模型可以用于生成文本,如生成对话、生成摘要、生成文章等,对于对话系统、自动写作、自动摘要等任务具有很大的应用潜力。
[0014]2、语言理解任务:大语言模型可以用于语言理解任务,如命名实体识别、情感分析、文本分类等,对于搜索引擎、推荐系统等具有很大的应用潜力。
[0015]3、语言增强任务:大语言模型可以用于文本数据增强,通过生成新的文本数据,扩充原始数据集,提高模型的泛化能力和鲁棒性。
[0016]4、机器翻译:大语言模型可以用于机器翻译,如谷歌的GNMT(Google Neural MachineTranslation)模型就是一种基于大语言模型的机器翻译模型,其通过序列到序列的方式进行翻译。
[0017]5、文本生成与排版:大语言模型可以用于文本生成和排版,如自动生成新闻标题、自动排版等任务。
[0018]然而,在实际应用过程中,大语言模型在为用户提供优质内容的同时,也可能生成具有潜在危害的内容。一方面,大语言模型的训练数据来源于互联网和其他文本数据,其中不可避免地会包含错误、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本数据训练生成对抗网络的方法,其特征在于,所述生成对抗网络包括第一代生成器和第一代判别器,所述方法包括:获取用于训练所述第一代生成器的文本数据集合;将所述文本数据集合中的每个文本数据输入到所述第一代生成器,并通过所述第一代生成器对每个文本数据进行识别处理,生成所述文本数据集合对应的目标文本数据集合;将所述目标文本数据集合中每个目标文本数据输入到所述第一代判别器,并通过所述第一代判别器对每个目标文本数据进行判别处理,得到每个目标文本数据是否包含有害内容的评分;根据每个目标文本数据是否包含有害内容的评分,确定所述目标文本数据集合中目标文本数据包含有害内容的有害率;以所述目标文本数据集合中目标文本数据包含有害内容的有害率作为所述第一代生成器的生成奖励得分,通过强化学习算法对所述第一代生成器进行强化学习训练;循环上述步骤,直至所述第一代生成器收敛停止训练,得到目标生成器。2.根据权利要求1所述的方法,其特征在于,在将所述目标文本数据集合中每个目标文本数据输入到所述第一代判别器之前,所述方法包括:获取用于训练判别器的标注文本数据,所述标注文本数据包括通过所述第一代生成器获取的有害文本数据和无害文本数据;将所述有害文本数据和所述无害文本数据输入到所述判别器,并通过所述判别器分别判断所述有害文本数据和所述无害文本数据是否包含有害内容,得到所述有害文本数据是否包含有害内容的评分和所述无害文本数据是否包好有害内容的评分;当所述有害文本数据是否包含有害内容的评分和所述无害文本数据是否包好有害内容的评分分别满足初始预设条件时,停止训练,得到所述第一代判别器。3.根据权利要求2所述的方法,其特征在于,在所述第一代生成器收敛之后,所述方法还包括:获取用于训练所述第一代判别器的文本数据集合;将用于训练所述第一代判别器的文本数据集合中的每个文本数据输入到所述目标生成器,并通过所述目标生成器对用于训练所述第一代判别器的文本数据集合中的每个文本数据进行识别处理,生成用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合;将用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据输入到所述第一代判别器,并通过所述第一代判别器判断用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据是否包含有害内容,得到用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据是否包含有害内容的评分;当用于训练所述第一代判别器的文本数据集合对应的目标文本数据集合中的每个目标文本数据是否包含有害内容的评分满足目标预设条件时,停止训练,得到目标判别器。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取待识别的文本数据;将所述待识别的文本数据输入到所述目标生成器,通过所述目标生成器对所述待识别
的文本数据进行识别处理,生成所述待识别的文本数据对应的目标文本数据;基于预设过滤规则,对所述待识别的文本数据对应的目标文本数据进行过滤处理,确定所述待识别的文本数据对应的目标文本数据是否包含有害内容,所述预设过滤规则包括基于正则表达式设置的过滤规则、基于硬匹配方式设置的过滤规则、以及基于软匹配方式设置的过滤规则。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取待识别的文本数据;将所述待识别的文本数据输入到所...

【专利技术属性】
技术研发人员:暴宇健王芳
申请(专利权)人:深圳须弥云图空间科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1