文本分类模型训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：38392778 阅读：13 留言：0更新日期：2023-08-05 17:45

本发明专利技术公开了一种文本分类模型训练方法，该方法获取文本训练数据集；在训练过程中对初始本地模型执行动态学习率调整操作，得到预测标签；根据同一文本训练数据对应的样本标签和所有预测标签，确定预测损失值，并根据预测损失值对所有文本训练数据进行筛选，得到目标文本数据；通过目标文本数据对第一本地模型进行训练，得到第二本地模型；获取第二本地模型对应的本地模型参数，以令服务器根据所有客户端发送的本地模型参数生成文本分类模型。本发明专利技术通过所有文本训练数据对初始本地模型进行训练，实现了对不同学习率下预测损失值的确定。通过目标文本数据对第一本地模型的训练，得到第二本地模型，提高了第二本地模型预测的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
文本分类模型训练方法、装置、计算机设备及存储介质

[0001]本专利技术涉及模型构建
，尤其涉及一种文本分类模型训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着分布式机器学习和大数据分析的发展，联邦学习作为一种新型的分布式机器学习框架，满足了多个客户端在数据安全的要求下进行模型训练。在联邦学习场景下，多个客户端虽然增加了更多的数据，但也增加了数据噪声的风险。比如分类任务中的噪声标签问题，这些噪声标签会影响模型训练的准确性。
[0003]现有的解决标签噪声问题的技术，往往高度依赖于一个完全干净的参照数据集，这样的参照数据集要求标签信息完全准确。当参照数据集规模有限时，其类别分布和总体分布不一定一致，对于多分类任务来说模型预测结果的参考价值较低。

技术实现思路

[0004]本专利技术实施例提供一种文本分类模型训练方法、装置、计算机设备及存储介质，以解决现有技术中文本训练数据集存在噪音文本数据的问题。
[0005]一种文本分类模型训练方法，所述文本分类模型训练方法应用在联邦学习系统中的至少一个客户端中；所述联邦学习系统还包括服务器，包括：
[0006]获取文本训练数据集；所述文本训练数据集中包括至少一个文本训练数据；一个所述文本训练数据关联一个样本标签；
[0007]在通过所述文本训练数据对初始本地模型进行训练过程中，对所述初始本地模型执行动态学习率调整操作，获取所述初始本地模型输出所述文本训练数据在不同学习率下的预测标签；
[0008]根据同...

【技术保护点】

【技术特征摘要】
1.一种文本分类模型训练方法，其特征在于，所述文本分类模型训练方法应用在联邦学习系统中的至少一个客户端中；所述联邦学习系统还包括服务器；所述文本分类模型训练方法包括：获取文本训练数据集；所述文本训练数据集中包括至少一个文本训练数据；一个所述文本训练数据关联一个样本标签；在通过所述文本训练数据对初始本地模型进行训练过程中，对所述初始本地模型执行动态学习率调整操作，获取所述初始本地模型输出所述文本训练数据在不同学习率下的预测标签；根据同一所述文本训练数据对应的样本标签和所有预测标签，确定所述文本训练数据对应的预测损失值，并根据所述预测损失值对所有所述文本训练数据进行筛选，得到目标文本数据；通过所述目标文本数据对第一本地模型进行训练，得到第二本地模型；所述第一本地模型通过所述文本训练数据对初始本地模型进行训练得到；获取所述第二本地模型对应的本地模型参数，并将所述本地模型参数发送至所述服务器中，以令所述服务器根据所有所述客户端发送的本地模型参数生成文本分类模型。2.如权利要求1所述的文本分类模型训练方法，其特征在于，所述对所述初始本地模型执行动态学习率调整操作，获取所述初始本地模型输出所述文本训练数据在不同学习率下的预测标签，包括：通过所述初始本地模型中的卷积层对所述文本训练数据进行卷积处理，得到卷积特征向量；通过所述初始本地模型中的最值池化层对所述卷积特征向量进行池化处理，得到池化特征向量；将所述池化特征向量输入至所述初始本地模型中的残差网络层，并获取所述残差网络层输出的残差特征向量；通过所述初始本地模型中的全局均值池化层对所述残差特征向量进行池化处理，得到均值池化向量；通过所述初始本地模型中的全连接层对所述均值池化向量进行预测，得到所述预测标签。3.如权利要求1所述的文本分类模型训练方法，其特征在于，所述根据所述预测损失值对所有所述文本训练数据进行筛选，得到目标文本数据，包括：对所有所述预测损失值进行加权处理，得到各文本训练数据对应的预测样本值；根据所有所述预测样本值对所有所述文本训练数据进行筛选，得到目标文本数据，并将所述文本训练数据对应的所述样本标签确定为所述目标文本数据对应的目标标签。4.如权利要求3所述的文本分类模型训练方法，其特征在于，所述根据所有所述预测样本值对所有所述文本训练数据进行筛选，得到目标文本数据，包括：对所有所述预测样本值进行排序，并确定所述预测样本值中的下四分位数、上四分位数以及四分位距，得到箱形图；根据所述上四分位数以及所述四分位距，确定区间最小值；将所有所述预测样本值和所述区间最小值进行比较，将小于所述区间最小值的所述预
测样本值对应的所述文本训练数据确定为所述目标文本数据。5.如权利要求3所述的文本分类模型训练方法，其特征在于，所述对所有所述预测损失值进行加权处理，得到各文本训练数据对应的预测样本值，包括：对所有所述预测损失值进行均值处理，得到各文本训练数据对应的平均损失值；对所有所述预测损失值进行方差处理，得到各...

【专利技术属性】
技术研发人员：李泽远，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人