文本纠错处理方法、模型处理方法、装置、设备及介质制造方法及图纸

技术编号：38999492 阅读：12 留言：0更新日期：2023-10-07 10:31

本申请涉及深度学习、自然语言处理技术领域，公开了一种文本纠错处理方法、模型处理方法、装置、设备及介质，用于降低文字识别误判率，方法部分包括：通过目标文本纠错模型的文本纠错模块对识别文本进行文本纠错，得到已纠错文本，目标文本纠错模型通过如下方式训练得到：将训练文本输入到被训练模型的文本纠错模块进行文本纠错处理，得到文本纠错结果；将训练文本输入到被训练模型的错字识别模块进行错字概率识别，得到错字识别结果；根据文本纠错结果和错字识别结果，获取被训练模型的模型总损失；将训练后模型总损失符合预设损失值的被训练模型，作为目标文本纠错模型。作为目标文本纠错模型。作为目标文本纠错模型。

全部详细技术资料下载

【技术实现步骤摘要】
文本纠错处理方法、模型处理方法、装置、设备及介质

[0001]本申请涉及自然语言处理
，尤其涉及一种文本纠错处理方法、模型处理方法、装置、设备及介质。

技术介绍

[0002]常用的文本纠错方法包括错别字词典、编辑距离和语言模型等方式。构建错别字词典人工成本较高，适用于错别字有限的部分垂直领域；编辑距离采用类似字符串模糊匹配的方法，通过对照正确样本可以纠正部分常见错别字和语病，但是通用性不足，因此，现阶段学术界和工业界研究的重点一般是基于语言模型的文字纠错技术。
[0003]专利技术人研究发现，传统的文字纠错技术中，会导致误判率较高。

技术实现思路

[0004]本申请提供一种文本纠错处理方法、模型处理方法、装置、设备及介质，以解决现有会导致误判率较高的技术问题。
[0005]第一方面，提供了一种文本纠错处理方法，所述方法包括：通过目标文本纠错模型对识别文本进行文本纠错，得到已纠错文本，所述目标文本纠错模型通过如下方式训练得到：将训练文本输入到被训练模型的文本纠错模块进行文本纠错处理，得到文本纠错结果；将训练文本输入到所述被训练模型的错字识别模块进行错字概率识别，得到错字识别结果；根据所述文本纠错结果和错字识别结果，获取所述被训练模型的模型总损失；将训练后所述模型总损失符合预设损失值的所述被训练模型，作为所述目标文本纠错模型。
[0006]进一步地，所述文本纠错模块包括第一编码层、第二编码层、第一BERT层、第二BERT层和第一全连接层；所述第一编码层用于对所述训练文本进行编...

【技术保护点】

【技术特征摘要】
1.一种文本纠错处理方法，其特征在于，所述方法包括：通过目标文本纠错模型对识别文本进行文本纠错，得到已纠错文本，所述目标文本纠错模型通过如下方式训练得到：将训练文本输入到被训练模型的文本纠错模块进行文本纠错处理，得到文本纠错结果；将训练文本输入到所述被训练模型的错字识别模块进行错字概率识别，得到错字识别结果；根据所述文本纠错结果和错字识别结果，获取所述被训练模型的模型总损失；将训练后所述模型总损失符合预设损失值的所述被训练模型，作为所述目标文本纠错模型。2.如权利要求1所述的文本纠错处理方法，其特征在于，所述文本纠错模块包括第一编码层、第二编码层、第一BERT层、第二BERT层和第一全连接层；所述第一编码层用于对所述训练文本进行编码，得到第一编码向量，所述第二编码层用于对所述训练文本进行编码，得到第二编码向量；所述第一BERT层用于对所述第一编码向量进行转换，得到第一矩阵；所述二BERT层用于对所述第二编码向量进行转换，得到第二矩阵；所述第一全连接层用于根据所述第一矩阵和所述第二矩阵的相加结果进行文字纠错，得到所述文本纠错结果；其中，所述第一矩阵表示所述第一编码向量的维度与所述训练文本的token长度的乘积，所述第二矩阵表示所述第二编码向量的维度与所述训练文本的token长度的乘积。3.如权利要求1所述的文本纠错处理方法，其特征在于，所述错字识别模块包括第二编码层、第二BERT层和第二全连接层；所述第二编码层用于对所述训练文本进行编码，得到第二编码向量；所述二BERT层用于对所述第二编码向量进行转换处理，得到第二矩阵；所述第二全连接层用于根据所述第二矩阵进行错字概率识别，得到所述错字识别结果；所述第二矩阵表示所述第二编码向量的维度与所述训练文本的token长度的乘积。4.如权利要求2所述的文本纠错处理方法，其特征在于，所述第一BERT层和所述第二BERT层表示同一BERT层，所述第一编码层和第二编码层表示同一编码层。5.如权利要求1所述的文本纠错处理方法，其特征在于，所述根...

【专利技术属性】
技术研发人员：陈东来，
申请(专利权)人：深圳前海环融联易信息科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人