一种文本预测方法和装置制造方法及图纸

技术编号：39430991 阅读：12 留言：0更新日期：2023-11-19 16:15

本申请实施例提供了一种文本预测方法，该方法包括：基于初始预测模型确定输入样本对应的对抗样本和难负例表征；根据对抗样本和难负例表征对初始预测模型进行训练，获得目标预测模型；基于目标预测模型对待预测文本进行预测，确定待预测文本对应的预测结果

全部详细技术资料下载

【技术实现步骤摘要】
一种文本预测方法和装置、及存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种文本预测方法和装置
、
及存储介质
。

技术介绍

[0002]随着信息化时代的来临，文本数据的规模在呈指数级的暴涨，在实际使用场景中，由于数据的来源和产生环境各异，其质量也难以得到有效保证，比如，现实中的文本可能包含口语化表述
、
方言词汇
、
自动语音识别
(Automatic Speech Recognition
，
ASR)
转录错误等多种错误
。
这样的文本质量经常会导致线上的人工智能
(Artificial Intelligence
，
AI)
服务难以准确理解其真实语义，从而导致错误的推理
。
[0003]而目前常见的解决方案都需要先进行人工设计以获取对抗样本来增强模型的鲁棒性，这不仅极大地耗费了从业人员的精力，且受限于当前数据集的规模和质量，难以从模型层面真正提升鲁棒性，进而降低了模型的文本预测效果和准确性
。

技术实现思路

[0004]本申请实施例提供了一种文本预测方法和装置
、
及存储介质，可以从模型层面真正提升鲁棒性，从而提升了模型的文本预测效果和准确性
。
[0005]本申请实施例的技术方案是这样实现的：
[0006]第一方面，本申请实施例提供了一种文本预测方法，所述文本预测方法包括：
...

【技术保护点】

【技术特征摘要】
1.
一种文本预测方法，所述方法包括：基于初始预测模型确定输入样本对应的对抗样本和难负例表征；根据所述对抗样本和所述难负例表征对所述初始预测模型进行训练，获得目标预测模型；基于所述目标预测模型对待预测文本进行预测，确定所述待预测文本对应的预测结果
。2.
根据权利要求1所述的方法，其特征在于，所述初始预测模型包括第一编码器
、
第二编码器以及第三编码器
。3.
根据权利要求2所述的方法，其特征在于，所述基于初始预测模型确定输入样本对应的对抗样本，包括：将所述输入样本输入至所述第一编码器，确定第一文本表征；将所述输入样本输入至所述第二编码器，确定第二文本表征；根据所述第一文本表征和所述第二文本表征确定所述对抗样本
。4.
根据权利要求2所述的方法，其特征在于，所述根据所述第一文本表征和所述第二文本表征确定所述对抗样本，包括：基于所述第一文本表征
、
所述第二文本表征和双边判定器确定所述对抗样本
。5.
根据权利要求2所述的方法，其特征在于，所述方法还包括：将所述输入样本输入至所述第三编码器，确定第一输入样本表征；基于所述第一输入样本表征确定第二输入样本表征
。6.
根据权利要求5所述的方法，其特征在于，所述基于初始预测模型确定输入样本对应的难负例表征，包括：基于所述第一输入样本表征和所述第二输入样本表征确定所述难负例表征
。7.
根据权利要求6所述的方法，其特征在于，所述根据所述对抗样本和所述难负例表征对所述初始预测模型进行训练，获得目标预测模型，包括：基于所述对抗样本确定第一损失函数；基于所述难负例表征...

【专利技术属性】
技术研发人员：刘杰，高珊，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人