文本特征的提取方法、装置、电子设备和存储介质制造方法及图纸

技术编号：41125665 阅读：4 留言：0更新日期：2024-04-30 17:53

本申请提供的文本特征的提取方法、装置、电子设备和存储介质，属于人工智能技术领域，所述方法包括：在获取到待处理文本时，将多语言模型组合中最高层级的大型语言模型作为目标大型语言模型，待处理文本作为输入数据；将输入数据输入至目标大型语言模型，得到待处理文本特征；在多语言模型组合中存在位于目标大型语言模型下一层级的大型语言模型时，将下一层级的大型语言模型作为目标大型语言模型，待处理文本特征作为输入数据，重新执行将输入数据输入至目标大型语言模型，得到待处理文本特征的步骤；在多语言模型组合中不存在位于目标大型语言模型下一层级的大型语言模型时，将目标大型语言模型最后输出的待处理文本特征作为目标文本特征。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于人工智能，特别涉及一种文本特征的提取方法、装置、电子设备和存储介质。

技术介绍

1、大型语言模型(large language model，llm)是一种人工智能模型，旨在理解和生成人类语言的机器模型。大型语言模型可以基于用户输入内容回复各种对应的内容，是一种强大的语言模型。

2、但是现有的大型语言模型仍然存在一定的错误率，这主要是用于大型语言模型推理能力较弱，若某单一大语言模型将注意力集中在错误的方向，就会导致大型语言模型的认知发生错误，用户将难以通过大型语言模型获取到所需的文本特征，这就降低大语言模型对文本特征进行提取的准确性。

技术实现思路

1、本申请提供了一种文本特征的提取方法、装置、电子设备和存储介质。

2、本申请一些实施例提供一种文本特征的提取方法，所述方法包括：

3、在获取到待处理文本时，将多语言模型组合中最高层级的大型语言模型作为目标大型语言模型，所述待处理文本作为输入数据，所述多语言模型组合包括至少两个层级的大型语言模型，所述多语言模型组合中最低层级的大型语言模型存在一个，所述多语言模型组合中大型语言模型的层级与使用顺序呈正相关关系；

4、将所述输入数据输入至所述目标大型语言模型，得到待处理文本特征；

5、在所述多语言模型组合中存在位于所述目标大型语言模型下一层级的大型语言模型时，将所述下一层级的大型语言模型作为目标大型语言模型，所述待处理文本特征作为输入数据，重新执行所述将所述输入数据输入至所

6、在所述多语言模型组合中不存在位于所述目标大型语言模型下一层级的大型语言模型时，将所述目标大型语言模型最后输出的待处理文本特征作为目标文本特征。

7、可选地，所述将所述输入数据输入至所述目标大型语言模型，得到待处理文本特征，包括：

8、在存在对于所述目标大型语言模型的注意力提示信息时，将所述输入数据输入至所述目标大型语言模型，识别所述输入数据与所述注意力提示信息相匹配的干扰数据；

9、删除所述输入数据中的所述干扰数据，得到待处理文本特征。

10、可选地，所述将所述输入数据输入至所述目标大型语言模型，识别所述输入数据与所述注意力提示信息相匹配的干扰数据，包括：

11、在所述注意力提示信息用于描述排除无关数据时，识别所述输入数据中与上下文的相关度低于相关度阈值的无关数据；

12、所述删除所述输入数据中的所述干扰数据，得到待处理文本特征，包括：

13、删除所述输入数据中的无关数据，得到待处理文本特征。

14、可选地，所述将所述输入数据输入至所述目标大型语言模型，识别所述输入数据与所述注意力提示信息相匹配的干扰数据，包括：

15、在所述注意力提示信息用于描述排除用户意见时，将所述输入数据输入至所述目标大型语言模型，识别所述输入数据中各部分内容为用户意见的概率值，将所述概率值大于概率阈值的文本数据，作为用户意见；

16、所述删除所述输入数据中的无关数据，得到待处理文本特征，包括：

17、删除所述输入数据中所述用户意见，得到待处理文本特征。

18、可选地，所述将所述输入数据输入至所述目标大型语言模型，得到待处理文本特征，包括：

19、在当前层级存在多个大型语言模型时，将所述输入数据分别输入至每个所述目标大型语言模型，得到每个所述目标大型语言模型相对应的待处理文本特征；

20、将所有所述待处理文本特征分别输入至下一层级的目标大型语言模型，更新所述待处理文本特征。

21、可选地，所述多语言模型组合中大型语言模型的通过如下步骤训练得到：

22、获取样本文本和标准文本特征；

23、将所述样本文本输入至所述多语言模型组合中，得到每个所述大型语言模型相对应的样本文本特征；

24、获取每个所述样本文本特征与所述标准文本特征之间的相似度；

25、基于所对应的相似度对于所述大型语言模型进行参数调整。

26、可选地，所述基于所对应的相似度对于所述大型语言模型进行参数调整，包括：

27、在所述相似度满足相似度要求时，基于奖励函数对所述大型语言模型进行参数调整；

28、在所述相似度不满足相似度要求时，基于惩罚函数对所述大型语言模型进行参数调整。

29、本申请一些实施例提供一种文本特征的提取装置，所述装置包括：

30、输入模块，用于在获取到待处理文本时，将多语言模型组合中最高层级的大型语言模型作为目标大型语言模型，所述待处理文本作为输入数据，所述多语言模型组合包括至少两个层级的大型语言模型，所述多语言模型组合中最低层级的大型语言模型存在一个，所述多语言模型组合中大型语言模型的层级与使用顺序呈正相关关系；

31、处理模块，用于将所述输入数据输入至所述目标大型语言模型，得到待处理文本特征；

32、在所述多语言模型组合中存在位于所述目标大型语言模型下一层级的大型语言模型时，将所述下一层级的大型语言模型作为目标大型语言模型，所述待处理文本特征作为输入数据，输入所述处理模块；

33、输出模块，用于在所述多语言模型组合中不存在位于所述目标大型语言模型下一层级的大型语言模型时，将所述目标大型语言模型最后输出的待处理文本特征作为目标文本特征。

34、可选地，所述处理模块，还用于：

35、在存在对于所述目标大型语言模型的注意力提示信息时，将所述输入数据输入至所述目标大型语言模型，识别所述输入数据与所述注意力提示信息相匹配的干扰数据；

36、删除所述输入数据中的所述干扰数据，得到待处理文本特征。

37、可选地，所述处理模块，还用于：

38、在所述注意力提示信息用于描述排除无关数据时，识别所述输入数据中与上下文的相关度低于相关度阈值的无关数据；

39、删除所述输入数据中的无关数据，得到待处理文本特征。

40、可选地，所述处理模块，还用于：

41、在所述注意力提示信息用于描述排除用户意见时，将所述输入数据输入至所述目标大型语言模型，识别所述输入数据中各部分内容为用户意见的概率值，将所述概率值大于概率阈值的文本数据，作为用户意见；

42、删除所述输入数据中所述用户意见，得到待处理文本特征。

43、可选地，所述处理模块，还用于：

44、在当前层级存在多个大型语言模型时，将所述输入数据分别输入至每个所述目标大型语言模型，得到每个所述目标大型语言模型相对应的待处理文本特征；

45、将所有所述待处理文本特征分别输入至下一层级的目标大型语言模型，更新所述待处理文本特征。

46、可选地，所述装置还包括：训练模块，用于：

47、获取样本文本和标准文本特征；

<本文档来自技高网...

【技术保护点】

1.一种文本特征的提取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述输入数据输入至所述目标大型语言模型，得到待处理文本特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述将所述输入数据输入至所述目标大型语言模型，识别所述输入数据与所述注意力提示信息相匹配的干扰数据，包括：

4.根据权利要求2所述的方法，其特征在于，所述将所述输入数据输入至所述目标大型语言模型，识别所述输入数据与所述注意力提示信息相匹配的干扰数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述将所述输入数据输入至所述目标大型语言模型，得到待处理文本特征，包括：

6.根据权利要求1所述的方法，其特征在于，所述多语言模型组合中大型语言模型的通过如下步骤训练得到：

7.根据权利要求6所述的方法，其特征在于，所述基于所对应的相似度对于所述大型语言模型进行参数调整，包括：

8.一种文本特征的提取装置，其特征在于，所述装置包括：

9.一种计算处理设备，其特征在于，包括：

...

【技术特征摘要】

1.一种文本特征的提取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述输入数据输入至所述目标大型语言模型，得到待处理文本特征，包括：

5.根据权利要求1所述的方法，其特征在...

【专利技术属性】
技术研发人员：赵鹏辉，李绍斌，唐杰，贾巨涛，黄鑫，
申请(专利权)人：珠海格力电器股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人