基于银行业务的文本纠错方法、装置、设备及存储介质制造方法及图纸

技术编号：39412463 阅读：8 留言：0更新日期：2023-11-19 16:04

本发明专利技术提供了基于银行业务的文本纠错方法、装置、设备及存储介质，该方法包括：获取银行数据库中的待训练句向量，对所述待训练句向量进行加权处理，得到文本输入数据；通过预设纠错模型对所述文本输入数据进行编码和解码，得到文本输出数据，利用损失函数计算所述文本输出数据的损失值，若所述损失值小于损失阈值，则将所述预设纠错模型作为最终纠错模型，将待测文本数据输入所述最终纠错模型，得到已纠错文本。本发明专利技术可以通过用户数据库中的句向量对预设纠错模型进行训练，利用预设纠错模型对句向量进行编码和解码，然后计算解码后的数据的损失函数，进而得到最终训练模型，然后利用最终训练模型即可完成文本纠错，本发明专利技术的纠错方法精度更高。错方法精度更高。错方法精度更高。

全部详细技术资料下载

【技术实现步骤摘要】
基于银行业务的文本纠错方法、装置、设备及存储介质

[0001]本专利技术涉及金融科技
，尤其涉及基于银行业务的文本纠错方法、装置、设备及存储介质。

技术介绍

[0002]文本纠错是对话系统中的重要技术，被广泛地使用在银行智能客服、银行智能聊天等相关场景中。文本纠错技术有基于主题模型的技术，有基于词语填充的技术，有基于词频的技术等。通过不同的技术组合，构建文本错误集合，可以对用户输入错误或者歧义的文本进行替换和纠正，从而达到语义明确的目的。
[0003]传统的文本纠错方法主要是借助机器学习或者统计学习方法来提取和构建文本对，当用户输入错误文本时，直接进行替换。这样速度快，但是不够精准，对于较长文本数据，没有丰富的语义信息，很难识别出错误文本。

技术实现思路

[0004]有鉴于此，本专利技术的目的是为了克服现有技术中的不足，提供了基于银行业务的文本纠错方法、装置、设备及存储介质。
[0005]本专利技术提供如下技术方案：
[0006]第一方面，本申请提供了基于银行业务的文本纠错方法，包括：
[0007]获取银行数据库中的待训练句向量，对所述待训练句向量进行加权处理，得到文本输入数据；
[0008]通过预设纠错模型对所述文本输入数据进行编码和解码，得到文本输出数据；
[0009]利用损失函数计算所述文本输出数据的损失值，若所述损失值小于损失阈值，则将所述预设纠错模型作为最终纠错模型；
[0010]将待测文本数据输入所述最终纠错模型，得到已纠错文本...

【技术保护点】

【技术特征摘要】
1.基于银行业务的文本纠错方法，其特征在于，包括：获取银行数据库中的待训练句向量，对所述待训练句向量进行加权处理，得到文本输入数据；通过预设纠错模型对所述文本输入数据进行编码和解码，得到文本输出数据；利用损失函数计算所述文本输出数据的损失值，若所述损失值小于损失阈值，则将所述预设纠错模型作为最终纠错模型；将待测文本数据输入所述最终纠错模型，得到已纠错文本。2.根据权利要求1所述的基于银行业务的文本纠错方法，其特征在于，所述获取银行数据库中的待训练句向量，包括：获取银行数据库中的待训练文本句，利用预设句向量处理模型对所述待训练文本句进行处理，得到待训练句向量。3.根据权利要求2所述的基于银行业务的文本纠错方法，其特征在于，所述对所述待训练句向量进行加权处理，得到文本输入数据，包括：利用分词工具对所述待训练句向量进行分词，得到字向量和词向量；获取字向量和词向量的平均值，将所述字向量和词向量的平均值作为文本输入数据。4.根据权利要求1所述的基于银行业务的文本纠错方法，其特征在于，所述预设纠错模型包括编码器和解码器，所述将所述文本输入数据输入到预设纠错模型进行编码和解码计算，得到文本输出数据，包括：将所述文本输入数据输入所述编码器进行编码处理，得到编码数据；将所述编码数据输入所述解码器进行解码处理，得到文本输出数据。5.根据权利要求4所述的基于银行业务的文本纠错方法，其特征在于，所述将所述编码数据输入所述解码器进行解码处理，得到文本输出数据，包括：利用掩码注意力方法计算所述编码数据中每个字向量的权重；对每个字向量的权重进行归一化处理，将每个字向量映射到预设的区间，得到字向量点集；利用全...

【专利技术属性】
技术研发人员：詹乐，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人