基于银行业务的文本纠错方法、装置、设备及存储介质制造方法及图纸

技术编号:39412463 阅读:8 留言:0更新日期:2023-11-19 16:04
本发明专利技术提供了基于银行业务的文本纠错方法、装置、设备及存储介质,该方法包括:获取银行数据库中的待训练句向量,对所述待训练句向量进行加权处理,得到文本输入数据;通过预设纠错模型对所述文本输入数据进行编码和解码,得到文本输出数据,利用损失函数计算所述文本输出数据的损失值,若所述损失值小于损失阈值,则将所述预设纠错模型作为最终纠错模型,将待测文本数据输入所述最终纠错模型,得到已纠错文本。本发明专利技术可以通过用户数据库中的句向量对预设纠错模型进行训练,利用预设纠错模型对句向量进行编码和解码,然后计算解码后的数据的损失函数,进而得到最终训练模型,然后利用最终训练模型即可完成文本纠错,本发明专利技术的纠错方法精度更高。错方法精度更高。错方法精度更高。

【技术实现步骤摘要】
基于银行业务的文本纠错方法、装置、设备及存储介质


[0001]本专利技术涉及金融科技
,尤其涉及基于银行业务的文本纠错方法、装置、设备及存储介质。

技术介绍

[0002]文本纠错是对话系统中的重要技术,被广泛地使用在银行智能客服、银行智能聊天等相关场景中。文本纠错技术有基于主题模型的技术,有基于词语填充的技术,有基于词频的技术等。通过不同的技术组合,构建文本错误集合,可以对用户输入错误或者歧义的文本进行替换和纠正,从而达到语义明确的目的。
[0003]传统的文本纠错方法主要是借助机器学习或者统计学习方法来提取和构建文本对,当用户输入错误文本时,直接进行替换。这样速度快,但是不够精准,对于较长文本数据,没有丰富的语义信息,很难识别出错误文本。

技术实现思路

[0004]有鉴于此,本专利技术的目的是为了克服现有技术中的不足,提供了基于银行业务的文本纠错方法、装置、设备及存储介质。
[0005]本专利技术提供如下技术方案:
[0006]第一方面,本申请提供了基于银行业务的文本纠错方法,包括:
[0007]获取银行数据库中的待训练句向量,对所述待训练句向量进行加权处理,得到文本输入数据;
[0008]通过预设纠错模型对所述文本输入数据进行编码和解码,得到文本输出数据;
[0009]利用损失函数计算所述文本输出数据的损失值,若所述损失值小于损失阈值,则将所述预设纠错模型作为最终纠错模型;
[0010]将待测文本数据输入所述最终纠错模型,得到已纠错文本
[0011]一种实施方式中,所述获取银行数据库中的待训练句向量,包括:
[0012]获取银行数据库中的待训练文本句,利用预设句向量处理模型对所述待训练文本句进行处理,得到待训练句向量。
[0013]一种实施方式中,所述对所述待训练句向量进行加权处理,得到文本输入数据,包括:
[0014]利用分词工具对所述待训练句向量进行分词,得到字向量和词向量;
[0015]获取字向量和词向量的平均值,将所述字向量和词向量的平均值作为文本输入数据。
[0016]一种实施方式中,所述预设纠错模型包括编码器和解码器,所述将所述文本输入数据输入到预设纠错模型进行编码和解码计算,得到文本输出数据,包括:
[0017]将所述文本输入数据输入所述编码器进行编码处理,得到编码数据;
[0018]将所述编码数据输入所述解码器进行解码处理,得到文本输出数据。
[0019]一种实施方式中,所述将所述编码数据输入所述解码器进行解码处理,得到文本输出数据,包括:
[0020]利用掩码注意力方法计算所述编码数据中每个字向量的权重;
[0021]对每个字向量的权重进行归一化处理,将每个字向量映射到预设的区间,得到字向量点集;
[0022]利用全连接函数对所述字向量点集进行切分,得到切分数据,将所述切分数据作为文本输出数据。
[0023]一种实施方式中,所述利用全连接函数对所述字向量点集进行切分,得到切分数据,包括:
[0024]若所述字向量点集中的字向量大于等于字向量阈值,则将所述字向量划分为第一切分数据;
[0025]若所述字向量点集中的字向量小于所述字向量阈值,则将所述字向量划分为第二切分数据。
[0026]一种实施方式中,所述利用损失函数计算所述文本输出数据的损失值之后,包括:
[0027]若所述损失值大于或等于所述损失阈值,则调整所述预设纠错模型的参数,直到所述损失值小于所述损失阈值。
[0028]第二方面,本申请还提供了基于银行业务的文本纠错装置,包括:
[0029]加权模块,用于获取银行业务系统中的待训练句向量,对所述待训练句向量进行加权处理,得到文本输入数据;
[0030]输出模块,用于通过预设纠错模型对所述文本输入数据进行编码和解码,得到文本输出数据;
[0031]计算模块,用于利用损失函数计算所述文本输出数据的损失值,若所述损失值小于损失阈值,则将所述预设纠错模型作为最终纠错模型;
[0032]纠错模块,用于将待测文本数据输入所述最终纠错模型,得到已纠错文本。
[0033]第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和至少一个处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实施如第一方面所述的基于银行业务的文本纠错方法。
[0034]第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如第一方面所述的基于银行业务的文本纠错方法。
[0035]本专利技术的实施例具有如下有益效果:
[0036]本专利技术提供的基于银行业务的文本纠错方法,通过银行数据库中的句向量对预设纠错模型进行训练,使得训练后的模型可以直接对待纠错文本进行纠错,从而得到已纠错的正确文本,纠错效果更精准。
[0037]为使本专利技术的上述目的、特征和优点能更明显和易懂,下文特举较佳实施例,并配合所附附图,做详细说明如下。
附图说明
[0038]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附
图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0039]图1示出了一种基于银行业务的文本纠错方法的流程示意图;
[0040]图2示出了一种文本输入数据获取方法的流程示意图;
[0041]图3示出了一种文本输入数据处理方法的流程示意图;
[0042]图4示出了一种编码数据解码方法的流程示意图;
[0043]图5示出了一种基于银行业务的文本纠错装置的框架结构示意图。
[0044]主元件符号说明:
[0045]500、基于银行业务的文本纠错装置;501、加权模块;502、输出模块;503、计算模块;504、纠错模块。
具体实施方式
[0046]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。
[0047]需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。相反,当元件被称作“直接在”另一元件“上”时,不存在中间元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
[0048]在本专利技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于银行业务的文本纠错方法,其特征在于,包括:获取银行数据库中的待训练句向量,对所述待训练句向量进行加权处理,得到文本输入数据;通过预设纠错模型对所述文本输入数据进行编码和解码,得到文本输出数据;利用损失函数计算所述文本输出数据的损失值,若所述损失值小于损失阈值,则将所述预设纠错模型作为最终纠错模型;将待测文本数据输入所述最终纠错模型,得到已纠错文本。2.根据权利要求1所述的基于银行业务的文本纠错方法,其特征在于,所述获取银行数据库中的待训练句向量,包括:获取银行数据库中的待训练文本句,利用预设句向量处理模型对所述待训练文本句进行处理,得到待训练句向量。3.根据权利要求2所述的基于银行业务的文本纠错方法,其特征在于,所述对所述待训练句向量进行加权处理,得到文本输入数据,包括:利用分词工具对所述待训练句向量进行分词,得到字向量和词向量;获取字向量和词向量的平均值,将所述字向量和词向量的平均值作为文本输入数据。4.根据权利要求1所述的基于银行业务的文本纠错方法,其特征在于,所述预设纠错模型包括编码器和解码器,所述将所述文本输入数据输入到预设纠错模型进行编码和解码计算,得到文本输出数据,包括:将所述文本输入数据输入所述编码器进行编码处理,得到编码数据;将所述编码数据输入所述解码器进行解码处理,得到文本输出数据。5.根据权利要求4所述的基于银行业务的文本纠错方法,其特征在于,所述将所述编码数据输入所述解码器进行解码处理,得到文本输出数据,包括:利用掩码注意力方法计算所述编码数据中每个字向量的权重;对每个字向量的权重进行归一化处理,将每个字向量映射到预设的区间,得到字向量点集;利用全...

【专利技术属性】
技术研发人员:詹乐
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1