文本纠错方法、装置、设备及介质制造方法及图纸

技术编号：36853810 阅读：62 留言：0更新日期：2023-03-15 17:34

本申请实施例提供了文本纠错方法、装置、设备及介质，通过将训练文本和由第一文本纠错模型的第一纠错结果输入至待训练的第二文本纠错模型进行训练，得到已训练的第二文本纠错模型；将待纠错文本输入至已训练的第二文本纠错模型得到已纠错文本；有效利用文本纠错模型来提升模型在文本纠错任务上的性能；第二文本纠错模型通过共享编码器学习第一文本纠错模型对错字的识别能力和修改能力，有效利用文本纠错模型来提升模型在文本纠错任务上的性能，通过学习程度调节组件调节共享编码器对第一文本纠错模型的学习程度，避免了共享编码器对文本纠错模型的输出结果过拟合，保证了对当前训练文本的特点的学习。训练文本的特点的学习。训练文本的特点的学习。

全部详细技术资料下载

【技术实现步骤摘要】
文本纠错方法、装置、设备及介质

[0001]本申请实施例涉及但不限于文本处理领域，尤其涉及文本纠错方法、装置、设备及介质。

技术介绍

[0002]文本纠错模型是发现文本中书写错误的文字，并将书写错误的文字修改为正确形式的算法模型。一般地，错字往往是正确形式的文字的近音字或形近字。文本纠错模型主要由识别模块和修改模块组成。识别模块旨在识别文本中错误的字的位置；修改模块旨在利用语言模型以及近音字和形近字词表预测正确的字。
[0003]现有的文本纠错方法往往忽略对其他已有的文本纠错模型输出结果的利用，或者只是简单地利用其他已有的文本纠错模型输出结果作为额外的输入特征，并不能充分学习已有的文本纠错模型，增加了模型训练时间，降低了模型的文本纠错效率。

技术实现思路

[0004]以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0005]本申请的目的在于至少一定程度上解决相关技术中存在的技术问题之一，本申请实施例提供了文本纠错方法、装置、设备及介质，能够有效利用已有的文本纠错模...

【技术保护点】

【技术特征摘要】
1.一种文本纠错方法，其特征在于，包括：获取训练文本；将所述训练文本输入至第一文本纠错模型，得到第一纠错结果；将所述训练文本和所述第一纠错结果输入至待训练的第二文本纠错模型进行训练，得到已训练的第二文本纠错模型，其中，所述第二文本纠错模型通过共享编码器学习所述第一文本纠错模型对错字的识别能力和修改能力，并通过学习程度调节组件调节所述共享编码器对所述第一文本纠错模型的学习程度；获取待纠错文本，将所述待纠错文本输入至已训练的第二文本纠错模型，得到已纠错文本。2.根据权利要求1所述的一种文本纠错方法，其特征在于，所述第二文本纠错模型包括识别模块和修改模块，所述共享编码器包括所述识别模块的第一共享编码器和所述修改模块的第二共享编码器，所述学习程度调节组件包括所述识别模块的第一子学习程度调节组件和所述修改模块的第二子学习程度调节组件；所述将所述训练文本和所述第一纠错结果输入至待训练的第二文本纠错模型进行训练，得到已训练的第二文本纠错模型，包括：获取所述训练文本中的文字的第一字嵌入向量；将所述第一字嵌入向量输入至所述识别模块，通过所述第一共享编码器对所述第一字嵌入向量进行编码得到文字的第一隐向量，根据所述第一隐向量和所述第一纠错结果进行错字识别预测，并通过所述第一学习程度调节组件调节所述一共享编码器对所述第一文本纠错模型的学习程度，得到与错字识别预测对应的第一损失值；根据所述第一字嵌入向量得到第二字嵌入向量；将所述第二字嵌入向量输入至所述修改模块，通过所述第二共享编码器对所述第二字嵌入向量进行编码得到文字的第二隐向量，根据所述第二隐向量和所述第一纠错结果进行错字修改预测，并通过所述第二学习程度调节组件调节所述二共享编码器对所述第一文本纠错模型的学习程度，得到与错字修改预测对应的第二损失值；根据所述第一损失值和所述第二损失值得到第一总损失值，根据所述第一总损失值调节待训练的第二文本纠错模型的参数，得到第三文本纠错模型；去除所述第三文本纠错模型的学习程度调节组件得到第四文本纠错模型，将所述训练文本输入至所述第四文本纠错模型进行训练，得到已训练的第二文本纠错模型。3.根据权利要求2所述的一种文本纠错方法，其特征在于，所述第一学习程度调节组件包括第一多任务学习组件和第一对抗学习判别器；所述根据所述第一隐向量和所述第一纠错结果进行错字识别预测，并通过所述第一学习程度调节组件调节所述一共享编码器对所述第一文本纠错模型的学习程度，得到与错字识别预测对应的第一损失值，包括：通过所述识别模块的第一主组件的第一主编码器对所述第一隐向量进行编码得到文字的第一关系抽取隐向量；根据所述第一关系抽取隐向量得到对应文字是错字的第一概率值，根据所述第一概率值得到表示为错字的文字的第一错字识别预测结果，对比所述第一错字识别预测结果与所述训练文本的错字标注结果得到第一对比结果，根据所述第一对比结果由第一损失函数得
到第一子损失值；通过所述第一多任务学习组件的第一辅编码器对所述第一隐向量进行编码得到文字的第二关系抽取隐向量，所述第二关系抽取隐向量与所述第一关系抽取隐向量不同；根据所述第二关系抽取隐向量得到对应文字是错字的第二概率值，根据所述第二概率值得到表示为错字的文字的第二错字识别预测结果，对比所述第二错字识别预测结果与所述第一纠错结果得到第二对比结果，根据所述第二对比结果由第一损失函数得到第二子损失值；将所述第二对比结果和所述第一隐向量输入至所述第一对抗学习判别器，得到所述第二对比结果的第一二值化结果，以及对应所述第一二值化结果的取值的第三概率值，根据所述第三概率值由第二损失函数得到第三子损失值，所述第二损失函数与所述第一损失函数不同；根据所述第一子损失值、所述第二子损失值和所述第三子损失值得到所述第一损失值。4.根据权利要求3所述的一种文本纠错方法，其特征在于，所述根据所述第一字嵌入向量得到第二字嵌入向量，包括：将所述第一概率值和掩码字符的字嵌入向量相乘得到第一乘积值；将预设常量与所述第一概率值...

【专利技术属性】
技术研发人员：宋彦，王伟，田元贺，郑毅，
申请(专利权)人：华润数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人