System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 回复文本预测方法、装置、终端设备及存储介质制造方法及图纸_技高网

回复文本预测方法、装置、终端设备及存储介质制造方法及图纸

技术编号:40971838 阅读:3 留言:0更新日期:2024-04-18 21:21
本申请实施例适用于计算机技术领域,提供了一种回复文本预测方法、装置、终端设备及存储介质,该方法包括:生成输入文本的第一输入向量;输入文本为目标领域的文本;将预训练权重合并至模型服务商提供的文本预测模型中;预训练权重用于为文本预测模型提供对目标领域的文本进行预测的能力;输入第一输入向量至文本预测模型中,得到输出向量;对输出向量进行解码,生成回复文本。采用上述方法,可以在提高预测的回复文本的准确率的基础上,还能够保证输入文本的数据隐私性。

【技术实现步骤摘要】

本申请属于计算机,尤其涉及一种回复文本预测方法、装置、终端设备及存储介质


技术介绍

1、由于模型训练通常需要大量且广泛的高质量数据集,用户只使用本地少量的隐私数据进行训练时,无法独自训练出高质量的文本预测模型。因此,在进行回复文本预测时,通常需要使用模型服务商中的高精度的文本预测模型。

2、然而,在使用模型服务商提供的文本预测模型时,需要将输入文本传输给模型服务商。若输入文本具有隐私数据,则将存在隐私数据泄漏的问题。

3、并且,文本预测模型可能为模型服务商基于各个领域的文本进行训练生成。虽然,文本预测模型可能对各个领域的文本进行预测回复均具有一定的准确性,然而,量化至具体领域时,其准确率可能无法达到用户的需求。


技术实现思路

1、本申请实施例提供了一种回复文本预测方法、装置、终端设备及存储介质,可以解决预测的回复文本的准确率较低,且容易泄露输入文本的数据隐私性的问题。

2、第一方面,本申请实施例提供了一种回复文本预测方法,该方法包括:

3、生成输入文本的第一输入向量;输入文本为目标领域的文本;

4、将预训练权重合并至模型服务商提供的文本预测模型中;预训练权重用于为文本预测模型提供对目标领域的文本进行预测的能力;

5、输入第一输入向量至文本预测模型中,得到输出向量;

6、对输出向量进行解码,生成回复文本。

7、第二方面,本申请实施例提供了一种回复文本预测装置,该装置包括:

8、第一生成模块,用于生成输入文本的第一输入向量;输入文本为目标领域的文本;

9、合并模块,用于将预训练权重合并至模型服务商提供的文本预测模型中;预训练权重用于为文本预测模型提供对目标领域的文本进行预测的能力;

10、输入模块,用于输入第一输入向量至文本预测模型中,得到输出向量;

11、第二生成模块,用于对输出向量进行解码,生成回复文本。

12、第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述第一方面的方法。

13、第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面的方法。

14、第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面的方法。

15、本申请实施例与现有技术相比存在的有益效果是:对于需要进行回复的目标领域的输入文本,为了保证输入文本的数据隐私性,终端设备可以在本地生成输入文本的第一输入向量,而不是直接将输入文本提供给模型服务商进行预测。之后,终端设备可以将第一输入向量和预训练权重输入至模型服务商中的文本预测模型中,并对文本预测模型输出的输出向量并进行解码,得到准确率高的回复文本。其中,因预训练权重为预先训练的用于为文本预测模型提供对目标领域的文本进行预测的能力,且模型服务商中的文本预测模型本身具有一定的文本预测能力(预测准确率高)。因此,可以认为在将预训练权重与文本预测模型合并后,能够进一步地提高文本预测模型对目标领域的输入文本进行回复的准确率。并且,文本预测模型的输入和输出均为向量,模型服务商中不包括向量的解码方式,进而,在提高预测的回复文本的准确率的基础上,还可以保证输入文本的数据隐私性。

本文档来自技高网...

【技术保护点】

1.一种回复文本预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将预训练权重合并至模型服务商提供的文本预测模型中,还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法,还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述对所述输出向量进行解码,生成回复文本,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述文本字符和当前循环过程中的所述第一输入向量,生成第二输入向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述字符向量和当前循环过程中的所述第一输入向量,生成所述第二输入向量,包括:

7.根据权利要求5所述的方法,其特征在于,所述文本字符还包括起始字符;所述若确定所述文本字符为所述结束字符,则根据获取到的所有所述文本字符生成所述回复文本,包括:

8.一种回复文本预测装置,其特征在于,所述装置包括:

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种回复文本预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将预训练权重合并至模型服务商提供的文本预测模型中,还包括:

3.根据权利要求1所述的方法,其特征在于,所述方法,还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述对所述输出向量进行解码,生成回复文本,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述文本字符和当前循环过程中的所述第一输入向量,生成第二输入向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述字符向量和当前循环过程中的所述第一输入向量,生成所述...

【专利技术属性】
技术研发人员:赵宇航姜文浩
申请(专利权)人:人工智能与数字经济广东省实验室深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1