System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本处理方法及装置、特征向量确定方法及装置制造方法及图纸_技高网

文本处理方法及装置、特征向量确定方法及装置制造方法及图纸

技术编号:41232661 阅读:3 留言:0更新日期:2024-05-09 23:48
本说明书实施例提供文本处理方法及装置、特征向量确定方法及装置,其中所述文本处理方法包括:确定目标文本问题,并将目标文本问题输入文本处理模型;在文本处理模型中,获得目标文本问题的初始特征向量;根据正向聚合特征向量、负向聚合特征向量对初始特征向量进行向量转换,获得目标文本问题的目标特征向量,其中,正向聚合特征向量通过在所述文本处理模型中对多个正向文本样本进行特征聚合获得,负向聚合特征向量通过在文本处理模型中对多个负向文本样本进行特征聚合获得;根据目标特征向量,获得目标文本问题对应的文本答案;向量转换后的目标特征向量加强了忠实度分量,削弱了不忠实度分量,提高了模型忠实度,能够输出更准确的答案。

【技术实现步骤摘要】

本说明书实施例涉及计算机,特别涉及一种文本处理方法及装置、一种特征向量确定方法及装置、一种文本处理模型训练方法及装置、一种文本处理交互系统、一种计算设备以及一种计算机可读存储介质。


技术介绍

1、在生成式搜索任务中,大模型会依据搜索结果回答用户输入的文本问题,在这个过程中,大模型的忠实度(faithfulness)是一个重要的衡量指标。忠实度高的大模型会在搜索结果中不包含文本问题对应的答案时进行拒绝识别;并在搜索结果中包含文本问题对应的答案时,参照搜索结果如实地输出答案而不进行胡编乱造。

2、实际应用中,大模型会有幻觉问题,导致在应该拒绝识别的场景下依然声称参考资料中存在答案;除此之外,大模型也会篡改所给的参考资料并生成相反的答案。因此,亟需一种文本处理方法,解决大模型的幻觉问题以及信息篡改的问题,提高大模型的忠实度,从而提高利用大模型进行问题答复的准确性。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种文本处理方法、特征向量确定方法。本说明书一个或者多个实施例同时涉及一种文本处理交互系统、文本处理装置、特征向量确定装置、文本处理模型训练装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种文本处理方法,包括:

3、确定目标文本问题,并将所述目标文本问题输入文本处理模型;

4、在所述文本处理模型中,获得所述目标文本问题的初始特征向量;

<p>5、根据正向聚合特征向量、负向聚合特征向量对所述初始特征向量进行向量转换,获得所述目标文本问题的目标特征向量,其中,所述正向聚合特征向量通过在所述文本处理模型中对多个正向文本样本进行特征聚合获得,所述负向聚合特征向量通过在所述文本处理模型中对多个负向文本样本进行特征聚合获得;

6、根据所述目标特征向量,获得所述目标文本问题对应的文本答案。

7、根据本说明书实施例的第二方面,提供了一种文本处理装置,包括:

8、确定模块,被配置为确定目标文本问题,并将所述目标文本问题输入文本处理模型;

9、向量获得模块,被配置为在所述文本处理模型中,获得所述目标文本问题的初始特征向量;

10、向量转换模块,被配置为根据正向聚合特征向量、负向聚合特征向量对所述初始特征向量进行向量转换,获得所述目标文本问题的目标特征向量,其中,所述正向聚合特征向量通过在所述文本处理模型中对多个正向文本样本进行特征聚合获得,所述负向聚合特征向量通过在所述文本处理模型中对多个负向文本样本进行特征聚合获得;

11、答案获得模块,被配置为根据所述目标特征向量,获得所述目标文本问题对应的文本答案。

12、根据本说明书实施例的第三方面,提供了一种特征向量确定方法,包括:

13、确定多个正向文本样本、多个负向文本样本;

14、将所述多个正向文本样本以及所述多个负向文本样本,输入文本处理模型;

15、在所述文本处理模型中,获得各正向文本样本对应的正向特征向量、以及各负向文本样本对应的负向特征向量;

16、利用预设的特征聚合算法,对多个正向特征向量进行聚合,获得正向聚合特征向量、以及利用所述预设的特征聚合算法,对多个负向特征向量进行聚合,获得负向聚合特征向量。

17、根据本说明书实施例的第四方面,提供了一种特征向量确定装置,包括:

18、确定模块,被配置为确定多个正向文本样本、多个负向文本样本;

19、输入模块,被配置为将所述多个正向文本样本以及所述多个负向文本样本,输入文本处理模型;

20、获得模块,被配置为在所述文本处理模型中,获得各正向文本样本对应的正向特征向量、以及各负向文本样本对应的负向特征向量;

21、聚合模块,被配置为利用预设的特征聚合算法,对多个正向特征向量进行聚合,获得正向聚合特征向量、以及利用所述预设的特征聚合算法,对多个负向特征向量进行聚合,获得负向聚合特征向量。

22、根据本说明书实施例的第五方面,提供了一种文本处理模型训练方法,包括:

23、确定多个正向文本样本、与所述多个正向文本样本对应的多个正向样本标签、多个负向文本样本,以及与所述多个负向文本样本对应的多个负向样本标签;

24、将所述多个正向文本样本、所述多个正向样本标签、所述多个负向文本样本以及所述多个负向样本标签,输入文本处理模型;

25、在所述文本处理模型中,获得各正向文本样本对应的正向特征向量、以及各负向文本样本对应的负向特征向量;

26、利用预设的特征聚合算法,对多个正向特征向量进行聚合,获得正向聚合特征向量、以及利用所述预设的特征聚合算法,对多个负向特征向量进行聚合,获得负向聚合特征向量;

27、根据所述多个正向文本样本、所述多个正向样本标签、所述正向聚合特征向量,所述多个负向文本样本、所述多个负向样本标签、以及所述负向特征向量对所述文本处理模型进行训练。

28、根据本说明书实施例的第六方面,提供了一种文本处理模型训练装置,包括:

29、确定模块,被配置为确定多个正向文本样本、与所述多个正向文本样本对应的多个正向样本标签、多个负向文本样本,以及与所述多个负向文本样本对应的多个负向样本标签;

30、输入模块,被配置为将所述多个正向文本样本、所述多个正向样本标签、所述多个负向文本样本以及所述多个负向样本标签,输入文本处理模型;

31、获得模块,被配置为在在所述文本处理模型中,获得各正向文本样本对应的正向特征向量、以及各负向文本样本对应的负向特征向量;

32、聚合模块,被配置为利用预设的特征聚合算法,对多个正向特征向量进行聚合,获得正向聚合特征向量、以及利用所述预设的特征聚合算法,对多个负向特征向量进行聚合,获得负向聚合特征向量;

33、训练模块,被配置为根据所述多个正向文本样本、所述多个正向样本标签、所述正向聚合特征向量,所述多个负向文本样本、所述多个负向样本标签、以及所述负向特征向量对所述文本处理模型进行训练。

34、根据本说明书实施例的第七方面,提供了一种文本处理交互系统,包括端侧设备以及云侧设备,其中,

35、所述端侧设备,用于向所述云侧设备发送文本处理请求,所述文本处理请求携带有目标文本问题;

36、所述云侧设备,用于接收所述文本处理请求,并应用上述文本处理方法对所述文本处理请求中的目标文本问题进行处理,获得所述目标文本问题对应的文本答案,并将所述文本答案返回至所述端侧设备。

37、根据本说明书实施例的第八方面,提供了一种计算设备,包括:

38、存储器和处理器;

39、所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本处本文档来自技高网...

【技术保护点】

1.一种文本处理方法,包括:

2.根据权利要求1所述的文本处理方法,所述根据正向聚合特征向量、负向聚合特征向量对所述初始特征向量进行向量转换之前,还包括:

3.根据权利要求2所述的文本处理方法,所述在所述文本处理模型中,获得各正向文本样本对应的正向特征向量、以及各负向文本样本对应的负向特征向量,包括:

4.根据权利要求2或3所述的文本处理方法,所述特征聚合算法为主成分分析方法;

5.根据权利要求2或3所述的文本处理方法,所述特征聚合算法为主成分分析方法;

6.根据权利要求4所述的文本处理方法,所述从所述多个正向主成分特征向量中,确定正向聚合特征向量,包括:

7.根据权利要求5所述的文本处理方法,所述从所述多个负向主成分特征向量中,确定负向聚合特征向量,包括:

8.根据权利要求1所述的文本处理方法,所述文本处理模型包括中间层、向量转换层以及输出层;

9.根据权利要求2所述的文本处理方法,所述文本处理模型包括中间层、向量转换层;

10.一种特征向量确定方法,包括:

11.根据权利要求10所述的特征向量确定方法,所述在所述文本处理模型中,获得各正向文本样本对应的正向特征向量、以及各负向文本样本对应的负向特征向量,包括:

12.根据权利要求10所述的特征向量确定方法,所述特征聚合算法为主成分分析方法;

13.根据权利要求10所述的特征向量确定方法,所述特征聚合算法为主成分分析方法;

14.根据权利要求12所述的特征向量确定方法,所述从所述多个正向主成分特征向量中,确定正向聚合特征向量,包括:

15.根据权利要求13所述的特征向量确定方法,所述从所述多个负向主成分特征向量中,确定负向聚合特征向量,包括:

16.根据权利要求10所述的特征向量确定方法,所述文本处理模型包括中间层以及向量转换层;

17.一种文本处理交互系统,包括端侧设备以及云侧设备,其中,

18.一种计算设备,包括:

19.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至9任意一项所述文本处理方法、或实现权利要求10至16任意一项所述特征向量确定方法的步骤。

...

【技术特征摘要】

1.一种文本处理方法,包括:

2.根据权利要求1所述的文本处理方法,所述根据正向聚合特征向量、负向聚合特征向量对所述初始特征向量进行向量转换之前,还包括:

3.根据权利要求2所述的文本处理方法,所述在所述文本处理模型中,获得各正向文本样本对应的正向特征向量、以及各负向文本样本对应的负向特征向量,包括:

4.根据权利要求2或3所述的文本处理方法,所述特征聚合算法为主成分分析方法;

5.根据权利要求2或3所述的文本处理方法,所述特征聚合算法为主成分分析方法;

6.根据权利要求4所述的文本处理方法,所述从所述多个正向主成分特征向量中,确定正向聚合特征向量,包括:

7.根据权利要求5所述的文本处理方法,所述从所述多个负向主成分特征向量中,确定负向聚合特征向量,包括:

8.根据权利要求1所述的文本处理方法,所述文本处理模型包括中间层、向量转换层以及输出层;

9.根据权利要求2所述的文本处理方法,所述文本处理模型包括中间层、向量转换层;

10.一种特征向量确定方法,包括:

11.根据...

【专利技术属性】
技术研发人员:丁瑞雪陈博理龙定坤张延钊刘楚谢朋峻
申请(专利权)人:浙江阿里巴巴机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1