数据扩充混合策略生成方法、装置和计算机设备制造方法及图纸

技术编号：26343167 阅读：25 留言：0更新日期：2020-11-13 20:42

本申请涉及人工智能技术领域，提供一种数据扩充混合策略生成方法、装置和计算机设备。所述方法包括：获取当前时间的策略反馈数据和训练数据，将当前时间的策略反馈数据输入至预设混合策略搜索模型，得到数据扩充混合策略，根据数据扩充混合策略扩充训练数据，得到扩充后的训练数据，将扩充后的训练数据输入至预设循环神经网络进行训练，得到数据扩充混合策略对应的策略反馈数据，将数据扩充混合策略对应的策略反馈数据作为当前时间的策略反馈数据，返回将当前时间的策略反馈数据输入至预设混合策略搜索模型的步骤，直至预设混合策略搜索模型的训练次数达到预设训练次数，得到最优的数据扩充混合策略。采用上述方法能提高数据扩充效率。

全部详细技术资料下载

【技术实现步骤摘要】
数据扩充混合策略生成方法、装置和计算机设备
本申请涉及人工智能
，特别是涉及一种数据扩充混合策略生成方法、装置、计算机设备和存储介质。
技术介绍
随着人工智能的不断发展，深度学习算法和机器学习也迎来了发展热潮。深度学习算法比如神经网络模型需要大量的训练数据，以保证模型的泛化能力。数据增强(数据扩充)是机器学习和深度学习中常见的数据处理手段，其能让有限的数据产生更多的数据，增加训练样本的数量以及多样性(噪声数据)，提升模型鲁棒性。在自然语言处理任务中，常见的数据扩充的方式包括同义词替换和反向翻译。目前，在自然语言处理任务中，标注数据的采集需要花费大量的人力成本，且收集的数据具有局限性，数据扩充混合策略通常是人为设计的，往往会出现策略与数据集不适合、或扩充量太大，使得训练的模型产生过拟合现象，使得自然语言数据扩充效率较低。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够提高自然语言数据扩充效率的数据扩充混合策略生成方法、装置、计算机设备和存储介质。一种数据扩充混合策略生成方法，方法包括：获取当前时间的策略反馈数据和训练数据；将当前时间的策略反馈数据输入至预设混合策略搜索模型，得到当前时间的数据扩充混合策略；根据数据扩充混合策略扩充训练数据，得到扩充后的训练数据；将扩充后的训练数据输入至预设循环神经网络进行训练，得到数据扩充混合策略对应的策略反馈数据；将数据扩充混合策略对应的策略反馈数据作为当前时间的策略反馈数据，返回将当前时间的...

【技术保护点】
1.一种数据扩充混合策略生成方法，其特征在于，所述方法包括：/n获取当前时间的策略反馈数据和训练数据；/n将所述当前时间的策略反馈数据输入至预设混合策略搜索模型，得到当前时间的数据扩充混合策略；/n根据所述数据扩充混合策略扩充所述训练数据，得到扩充后的训练数据；/n将扩充后的训练数据输入至预设循环神经网络进行训练，得到数据扩充混合策略对应的策略反馈数据；/n将所述数据扩充混合策略对应的策略反馈数据作为当前时间的策略反馈数据，返回将当前时间的策略反馈数据输入至预设混合策略搜索模型的步骤，以更新数据扩充混合策略，直至所述预设混合策略搜索模型的训练次数达到预设训练次数，得到最优的数据扩充混合策略。/n

【技术特征摘要】
1.一种数据扩充混合策略生成方法，其特征在于，所述方法包括：
获取当前时间的策略反馈数据和训练数据；
将所述当前时间的策略反馈数据输入至预设混合策略搜索模型，得到当前时间的数据扩充混合策略；
根据所述数据扩充混合策略扩充所述训练数据，得到扩充后的训练数据；
将扩充后的训练数据输入至预设循环神经网络进行训练，得到数据扩充混合策略对应的策略反馈数据；
将所述数据扩充混合策略对应的策略反馈数据作为当前时间的策略反馈数据，返回将当前时间的策略反馈数据输入至预设混合策略搜索模型的步骤，以更新数据扩充混合策略，直至所述预设混合策略搜索模型的训练次数达到预设训练次数，得到最优的数据扩充混合策略。

2.根据权利要求1所述的方法，其特征在于，所述根据所述数据扩充混合策略扩充所述训练数据，得到扩充后的训练数据包括：
使用已训练的MLM模型将所述训练数据中句子中的任一字符替换为掩码字符；
根据预训练的语言模型，预测所述掩码字符所对应的字符，得到预测字符；
若所述预测字符的置信度大于预设阈值，则将包含所述预测字符的训练数据作为扩充后的训练数据。

3.根据权利要求1所述的方法，其特征在于，所述根据所述数据扩充混合策略扩充所述训练数据，得到扩充后的训练数据包括：
将所述训练数据中的词语表示为词向量；
随机将所述训练数据中任一句子的字节片段表示为目标向量；
计算所述目标向量与所述词向量的相似度、并基于相似度查找出所述目标向量的同义词向量；
将所述字节片段替换为所述同义词向量对应的词语，得到扩充后的训练数据。

4.根据权利要求1所述的方法，其特征在于，所述根据所述数据扩充混合策略扩充所述训练数据，得到扩充后的训练数据包括：
基于所述训练数据，使用预训练的生成模型生成新的训练数据，得到扩充后的训练数据，所述预训练的生成模型基于历史句子数据训练得到。

5.根据权利要求4所述的方法，其特征在于，所述基于所述训练数据，使用预训练的生成模型生成新的训练数据，...

【专利技术属性】
技术研发人员：朱威，李恬静，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人