文本的处理方法和装置、存储介质及电子设备制造方法及图纸

技术编号:39261714 阅读:8 留言:0更新日期:2023-10-30 12:14
本申请公开了一种文本的处理方法和装置、存储介质及电子设备。其中,该方法包括:获取待确定分类结果的初始文本和预先确定的样本文本集合,通过目标置信度模型从样本文本集合中确定出目标展示文本,其中,样本文本集合中的样本文本用于通过目标置信度模型生成样本预测结果,样本预测结果用于确定相对应的样本文本关联的表示通过目标置信度模型对同一样本文本进行多轮预测产生的多个样本预测结果的不一致程度的不一致参数,利用目标展示文本和目标置信度模型生成目标提示模板,将初始文本与目标提示模板共同输入目标语言模型,得到初始文本的目标分类结果以及目标置信度。本申请解决了相关技术中文本分类准确率较低的技术问题。问题。问题。

【技术实现步骤摘要】
文本的处理方法和装置、存储介质及电子设备


[0001]本申请涉及计算机领域,具体而言,涉及一种文本的处理方法和装置、存储介质及电子设备。

技术介绍

[0002]近年来,伴随工业界积累的高质量数据增长,算力资源的增长以及大型模型架构和训练技术的发展,大语言模型例如GPT3等被广泛应用。相比于传统的“小模型”,大模型具有显著高的模型参数量,计算量和存储量,也因此具备更强的表达能力和数据拟合能力,从而大大提高了神经网络模型在各种业务中的性能天花板,甚至在很多任务上大大超过了人类专家水平。以GPT3为代表的大模型最强大的能力便是能够在无需调整原始模型参数条件下,通过情景学习(In

context Learning)进行小样本学习,因此情景学习使得大模型能够快速地迁移到各种下游任务,下游的开发者能够借助大模型的这种能力快速地构建新的应用。
[0003]因为大模型的推理过程需要占用大量的计算和存储资源,对于大部分个人或者企业用户来说,运行这样的模型可能是非常昂贵的,其次由于大模型训练本身的困难,训练出来的大模型参数属于宝贵财富因此不能对外公开。基于这些原因,现有的大模型通常通过云计算API接口的形式向用户提供相应的服务。这种黑盒的设定为用户提供便利的同时,也存在一些局限。假设开发者A基于大语言模型构建下游应用,开发者将原始输入样本输入大语言模型的API接口,大语言模型返回对应的分类结果。在上述流程中,大语言模型虽然返回了分类结果,但是缺乏该模型关于预测结果的置信度,导致下游任务无法判断决策结果的可靠性,进而导致文本的分类准确率难以保证。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种文本的处理方法和装置、存储介质及电子设备,以至少解决相关技术中文本分类准确率较低的技术问题。
[0006]根据本申请实施例的一个方面,提供了一种文本的处理方法,包括:获取待确定分类结果的初始文本和预先确定的样本文本集合;通过目标置信度模型从所述样本文本集合中确定出目标展示文本,其中,所述样本文本集合中的样本文本用于通过所述目标置信度模型生成样本预测结果,所述样本预测结果用于确定相对应的所述样本文本关联的不一致参数,所述不一致参数用于表示通过所述目标置信度模型对同一所述样本文本进行多轮预测产生的多个所述样本预测结果的不一致程度,所述不一致参数满足预设条件的所述样本文本被确定为所述目标展示文本;利用所述目标展示文本和所述目标置信度模型生成目标提示模板,其中,所述目标提示模板包括所述目标展示文本、所述目标展示文本对应的展示文本分类结果以及与所述展示文本分类结果对应的展示文本分类置信度;将所述初始文本与所述目标提示模板共同输入目标语言模型,得到所述初始文本的目标分类结果以及目标
置信度。
[0007]根据本申请实施例的另一方面,还提供了一种文本的处理装置,包括:获取模块,用于获取待确定分类结果的初始文本和预先确定的样本文本集合;确定模块,用于通过目标置信度模型从所述样本文本集合中确定出目标展示文本,其中,所述样本文本集合中的样本文本用于通过所述目标置信度模型生成样本预测结果,所述样本预测结果用于确定相对应的所述样本文本关联的不一致参数,所述不一致参数用于表示通过所述目标置信度模型对同一所述样本文本进行多轮预测产生的多个所述样本预测结果的不一致程度,所述不一致参数满足预设条件的所述样本文本被确定为所述目标展示文本;生成模块,用于利用所述目标展示文本和所述目标置信度模型生成目标提示模板,其中,所述目标提示模板包括所述目标展示文本、所述目标展示文本对应的展示文本分类结果以及与所述展示文本分类结果对应的展示文本分类置信度;处理模块,用于将所述初始文本与所述目标提示模板共同输入目标语言模型,得到所述初始文本的目标分类结果以及目标置信度。
[0008]可选地,所述装置用于通过如下方式通过目标置信度模型从所述样本文本集合中确定出目标展示文本:通过如下方式将所述样本文本集合中的样本文本输入所述目标置信度模型,确定所述样本预测结果,其中,每次输入所述目标置信度模型的样本文本视为目标样本文本:将所述目标样本文本输入所述目标置信度模型,进行L轮预测,得到L个样本预测结果,其中,所述L个样本预测结果包括L个预测标签,所述目标置信度模型在每轮预测过程中,通过调整所述目标置信度模型的参数完成所述L轮预测,L为大于1的正整数;对所述L个样本预测结果进行去重操作,得到K个样本预测结果,其中,所述去重操作用于删除所述L个预测标签中重复的预测标签,K为大于1且小于或等于L的正整数;根据所述L个预测结果和所述K个预测结果确定目标不一致参数;在所述目标不一致参数满足所述预设条件的情况下,将所述目标样本文本确定为所述目标展示文本。
[0009]可选地,所述装置用于通过如下至少之一方式通过调整所述目标置信度模型的参数完成所述L轮预测:通过调整所述目标置信度模型的温度参数,完成所述L轮预测,其中,所述温度参数用于控制所述样本预测结果的多样性和随机性;通过调整所述目标置信度模型的候选列表参数,完成所述L轮预测,其中,所述候选列表参数用于动态设置候选列表的大小,以将预测概率之和不超过预设值的标签列入所述候选列表,并从所述候选列表中确定所述预测标签;通过调整所述目标置信度模型的排序选择参数,完成所述L轮预测,其中,所述排序参数用于动态设置候选列表的大小,以将概率取值最大的多个标签列入所述候选列表,并从所述候选列表中确定所述预测标签。
[0010]可选地,所述装置用于通过如下方式将所述目标样本文本输入所述目标置信度模型,进行L轮预测,得到L个样本预测结果:将所述目标样本文本输入所述目标置信度模型,进行L轮预测,得到所述L个预测标签以及与所述L个预测标签对应的L个样本置信度;分别对所述L个预测标签和所述L个样本置信度分别进行集成运算,得到目标预测标签和目标样本置信度,其中,所述展示文本分类结果包括所述目标预测标签,所述展示文本分类置信度包括所述目标样本置信度。
[0011]可选地,所述装置用于通过如下方式利用所述目标展示文本和所述目标置信度模型生成目标提示模板:在所述目标展示文本包括多个的情况下,获取多个所述目标展示文本对应的所述目标预测标签和所述目标样本置信度;根据多个所述目标展示文本、多个所
述目标预测标签和多个所述目标样本置信度和所述目标置信度模型生成所述目标提示模板。
[0012]可选地,所述装置用于通过如下方式根据多个所述目标展示文本、多个所述目标预测标签和多个所述目标样本置信度和所述目标置信度模型生成所述目标提示模板:将多个所述目标展示文本、多个所述目标预测标签和多个所述目标样本置信度分别基于对应关系配置为多个展示样本;对所述多个展示样本进行拼接操作,得到第一模板结构,并将所述目标置信度模型确定为第二模板结构;根据所述第一模板结构和所述第二模板结构生成所述目标提示模板。
[0013]可选地,所述装置用于通过如下方式通过目标置信度模型从所述样本文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本的处理方法,其特征在于,包括:获取待确定分类结果的初始文本和预先确定的样本文本集合;通过目标置信度模型从所述样本文本集合中确定出目标展示文本,其中,所述样本文本集合中的样本文本用于通过所述目标置信度模型生成样本预测结果,所述样本预测结果用于确定相对应的所述样本文本关联的不一致参数,所述不一致参数用于表示通过所述目标置信度模型对同一所述样本文本进行多轮预测产生的多个所述样本预测结果的不一致程度,所述不一致参数满足预设条件的所述样本文本被确定为所述目标展示文本;利用所述目标展示文本和所述目标置信度模型生成目标提示模板,其中,所述目标提示模板包括所述目标展示文本、所述目标展示文本对应的展示文本分类结果以及与所述展示文本分类结果对应的展示文本分类置信度;将所述初始文本与所述目标提示模板共同输入目标语言模型,得到所述初始文本的目标分类结果以及目标置信度。2.根据权利要求1所述的方法,其特征在于,所述通过目标置信度模型从所述样本文本集合中确定出目标展示文本,包括:通过如下方式将所述样本文本集合中的样本文本输入所述目标置信度模型,确定所述样本预测结果,其中,每次输入所述目标置信度模型的样本文本视为目标样本文本:将所述目标样本文本输入所述目标置信度模型,进行L轮预测,得到L个样本预测结果,其中,所述L个样本预测结果包括L个预测标签,所述目标置信度模型在每轮预测过程中,通过调整所述目标置信度模型的参数完成所述L轮预测,L为大于1的正整数;对所述L个样本预测结果进行去重操作,得到K个样本预测结果,其中,所述去重操作用于删除所述L个预测标签中重复的预测标签,K为大于1且小于或等于L的正整数;根据所述L个预测结果和所述K个预测结果确定目标不一致参数;在所述目标不一致参数满足所述预设条件的情况下,将所述目标样本文本确定为所述目标展示文本。3.根据权利要求2所述的方法,其特征在于,所述通过调整所述目标置信度模型的参数完成所述L轮预测,包括以下至少之一:通过调整所述目标置信度模型的温度参数,完成所述L轮预测,其中,所述温度参数用于控制所述样本预测结果的多样性和随机性;通过调整所述目标置信度模型的候选列表参数,完成所述L轮预测,其中,所述候选列表参数用于动态设置候选列表的大小,以将预测概率之和不超过预设值的标签列入所述候选列表,并从所述候选列表中确定所述预测标签;通过调整所述目标置信度模型的排序选择参数,完成所述L轮预测,其中,所述排序参数用于动态设置候选列表的大小,以将概率取值最大的多个标签列入所述候选列表,并从所述候选列表中确定所述预测标签。4.根据权利要求2所述的方法,其特征在于,所述将所述目标样本文本输入所述目标置信度模型,进行L轮预测,得到L个样本预测结果,包括:将所述目标样本文本输入所述目标置信度模型,进行L轮预测,得到所述L个预测标签以及与所述L个预测标签对应的L个样本置信度;
分别对所述L个预测标签和所述L个样本置信度分别进行集成运算,得到目标预测标签和目标样本置信度,其中,所述展示文本分类结果包括所述目标预测标签,所述展示文本分类置信度包括所述目标样本置信度。5.根据权利要求4所述的方法,其特征在于,所述利用所述目标展示文本和所述目标置信度模型生成目标提示模板,包括:在所述目标展示文本包括多个的情况下,获取多个所述目标展示文本对应的所述目标预测标签和所述目标样本置信度;根据多个所述目标展示文本、多个所述目标预测标签和多个所述目标样本置信度和所述目标置信度模型生成所述目标提示模板。6.根据权利要求5所述的方法,其特征在于,所述根据多个所述目标展示文本、多个所述目标预测标签和多个所述目标样本置信度和所述目标置信度模型生成所述目标提示模板,包括:将多个所述目标展示文本、多个所述目标预测标签和多个所述目标样本置信度分别基于对应关系配置为多个展示样本;对所述多个展示样本进行拼接操作,得到第一模板结构,并将所述目标置信度模型确定为第二模板结构;根据所述第一模板结构和所述第二模板结构生成所述目标提示模板。7.根据权利要求1所述的方法,其特征在于,所述通过目标置信度模型从所述样本文本集合中确定出目标展示文本,包括:对所述样本文本集合中的样本文本分别进行解码操作,得到表征向量集合,其中,所述表征向量集合中的一个表征向量与一个所述样本文本对应,所述表征向量包括相对应的所述样本文本的语义信息;对所述表征向量集合执行聚类操作,确定多组样本文本,其中,每组样本文本用于表示所述表征向量之间的相似度满足预设相似条件的多个样本文本;将所述每组样本文本中所述不一致参数...

【专利技术属性】
技术研发人员:吴秉哲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1