一种神经网络模型的文本分布对抗训练方法及装置、情感分析方法制造方法及图纸

技术编号：36536607 阅读：43 留言：0更新日期：2023-02-01 16:22

为了解决情感分析模型可能会受到对抗攻击的问题，通过训练数据集中每个样本的对抗分布，来对模型进行对抗训练从而得到一个鲁棒的神经网络模型。本发明专利技术公开了一种神经网络模型的文本分布对抗训练方法，采取对抗训练的方法，通过求每个样本的对抗分布，从而探索在整个对抗空间中的对抗样本来训练神经网络模型，提升其鲁棒性。提升其鲁棒性。提升其鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络模型的文本分布对抗训练方法及装置、情感分析方法

[0001]本专利技术涉及互联网
，尤其涉及一种神经网络模型的文本分布对抗训练方法及装置、情感分析方法。

技术介绍

[0002]随着大数据时代的来临以及人工智能相关理论和技术不断取得新的突破，作为人工智能领域的研究热点和核心技术，深度学习被广泛应用于计算机视觉、自然语言处理以及语音识别等各个研究领域并且取得了巨大的成功。与此同时，大量的深度学习技术日趋成熟并逐步开始在工业界落地，极大地促进了深度学习的规模化、产业化发展。例如，在计算机视觉领域，深度学习驱动的人脸识别和目标检测模型作为智能安防系统的核心组件，已成为保障人民群众人身和财产安全的利器。
[0003]在自然语言处理领域，基于深度学习的文本处理和理解技术在文本分类、机器翻译、人机对话等核心任务中也取得了突破性进展并催生出诸如情感分析、在线有害文本检测、垃圾邮件过滤，智能客服等一系列重要的现实应用。在语音识别领域，根据中国语音产业联盟发布的数据显示，2017年全球智能语音市场规模将超过百亿美元，国内市场规模五年复合增长率将超过60％。在微软、百度、思必驰、科大讯飞等科技巨头的推动下，深度学习驱动的语音识别技术在语音助手、智能家居、智能车载等领域发展迅猛，为丰富和改善了人们的生活提供了极大的便利。
[0004]然而，尽管深度神经网络模型在现实世界中有着广泛的应用并且具有出色的表现，但其自身同样面临着诸多的安全威胁。最新研究表明，当面对恶意构造的对抗性样例时，即便是表现出色的深度神经网...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的文本分布对抗训练方法，其特征在于，包括：S1：获取训练数据集；S2：构建情感分析模型，情感分析模型包括词嵌入模型和双向循环神经网络，词嵌入模型用于根据输入的词得到词嵌入，双向循环神经网络对词嵌入构成的特征序列进一步编码得到序列信息，并得到序列信息的情感分析结果；S3：对构建的情感分析模型进行基于文本的对抗分布训练，具体包括：读取训练数据集中的样本，每个样本由一条评论及其对应的标签组成，训练过程中，加入损失函数，将一个批量的样本输入，然后对每一个样本进行分布预测，每一个样本的分布为高斯分布，高斯分布的平均值为方差为在每一个样本的词嵌入向量上加上一个初始化后的噪声，对其进行预测，将预测的结果和标签进行对比，并根据对比结果对噪声进行优化，得到样本的对抗分布；将每一个得到对抗分布的样本输入到情感分析模型中进行训练，对模型参数进行调整，得到训练好的情感分析模型。2.如权利要求1所述的神经网络模型的文本分布对抗训练方法，其特征在于，步骤S3的基于文本的对抗分布训练过程中，采用梯度下降算法对噪声进行优化，使用蒙特卡洛采样方法来估计每个样本的高斯分布，具体包括：对每个样本进行m次采样，再进行T步的梯度上升。3.如权利要求1所述的神经网络模型的文本分布对抗训练方法，其特征在于，利用变分推断估计样本的对抗分布。4.如权利要求1所述的神经网络模型的文本分布对抗训练方法，其特征在于，步骤S3中得到的样本的对抗分布的形式为：其中表示损失函数，f
θ
表示指分类器，是指第i个样本，是指为...

【专利技术属性】
技术研发人员：沈志东，岳恒宪，
申请(专利权)人：武汉大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人