System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大语言模型的级联共性问题挖掘方法技术_技高网

一种基于大语言模型的级联共性问题挖掘方法技术

技术编号:40305935 阅读:6 留言:0更新日期:2024-02-07 20:50
本发明专利技术公开了一种基于大语言模型的级联共性问题挖掘方法,涉及人工智能和自然语言处理技术领域。包括以下步骤:S1,使用小语言嵌入模型对文本问题进行特征向量表达,保留子问题数量最高的前第二数量的粗粒度共性问题;S2,使用大语言嵌入模型对所述原始文本问题进行特征向量表达,保留子问题数量最高的前第四数量的细粒度共性问题;S3,使用大语言通用模型进行总结归纳,获得第五数量的共性问题;S4,使用大语言通用模型进行命名实体识别,并对所述共性问题进行重要程度排序。本发明专利技术能以更高的精度和更快的速度挖掘和发现文本中的共性问题,还能有效利用大语言模型的深度学习特性,以减少对大量计算资源的依赖。

【技术实现步骤摘要】

本专利技术涉及人工智能和自然语言处理,尤其涉及一种基于大语言模型的级联共性问题挖掘方法


技术介绍

1、在当前大数据时代,由于文本数据和信息的爆炸性增长,快速、准确地发现和挖掘其中的共性问题对于决策支持、问题处理、信息检索等任务具有至关重要的意义。这些共性问题包括,但不限于,语言习惯、文本主题、情感态度、意图理解等。现有的文本问题聚类技术主要依赖于关键词匹配、主题建模等方法,往往存在一定的局限性,如精度不足、处理效率低下、易受噪声影响等问题。

2、随着大语言模型,如gpt系列和bert等预训练模型的出现,这些模型利用深度学习的技术进行文本的深度理解,有能力发现和处理更深层次的共性问题。然而,大语言模型的推理需要大量的计算资源,这在一定程度上限制了其在实际应用部署中的普遍性。因此,如何设计一种在效率和精度之间达到良好平衡,且适应各种场景的文本问题聚类和分析系统,是目前亟待解决的技术问题。


技术实现思路

1、为了解决
技术介绍
中提到的至少一个技术问题,本专利技术的目的在于提供一种基于大语言模型的级联共性问题挖掘方法,能以更高的精度和更快的速度挖掘和发现文本中的共性问题,还能有效利用大语言模型的深度学习特性,以减少对大量计算资源的依赖。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种基于大语言模型的级联共性问题挖掘方法,包括以下步骤:

4、s1,使用小语言嵌入模型对文本问题进行特征向量表达,并通过聚类算法抽取所有的文本问题的第一数量的粗粒度共性问题;保留子问题数量最高的前第二数量的粗粒度共性问题;

5、s2,获取所述前第二数量的粗粒度共性问题对应的原始文本问题,并使用大语言嵌入模型对所述原始文本问题进行特征向量表达,通过聚类算法抽取所述原始文本问题的第三数量的细粒度共性问题;保留子问题数量最高的前第四数量的细粒度共性问题;

6、s3,针对所述前第四数量的细粒度共性问题,使用大语言通用模型进行总结归纳,获得第五数量的共性问题;

7、s4,对得到的第五数量的共性问题,使用大语言通用模型进行命名实体识别,并对所述共性问题进行重要程度排序。

8、在本专利技术的某些实施例中,所述步骤s4之后还包括:

9、s5,基于历史数据构建共性问题数据库;以文本问题的特征向量作为键值k,共性问题作为值v,保存一个对应的字典用于保存文本问题和共性问题的元信息。

10、在本专利技术的某些实施例中,往所述共性问题数据库中添加新的文本问题时,计算所述新的文本问题与共性问题数据库中已有问题的特征向量的相似度;若所述相似度大于设定的第一相似度阈值,则加入该新的文本问题。

11、在本专利技术的某些实施例中,所述步骤s5之后还包括:

12、s6,对于新加入的文本问题,获取其特征向量表达,在共性问题数据库中进行检索,将新加入的文本问题加入到与其相似度最大的原始文本问题所属的共性问题中作为其子问题。

13、在本专利技术的某些实施例中,当新加入的文本问题与已有问题的相似度均小于第二相似度阈值;采用以下方式一进行分类:构造提示词,将已经抽取出的共性问题作为候选集合,使用大语言通用模型预测新加入的文本问题所属的共性问题。

14、在本专利技术的某些实施例中,当新加入的文本问题与已有问题的相似度均小于第二相似度阈值;采用以下方式二进行分类:以步骤s1至步骤s3中的<文本问题,共性问题>的映射对作为训练集进行学生模型的训练;通过训练好的学生模型预测新加入的文本问题所属的共性问题。

15、在本专利技术的某些实施例中,所述学生模型采用focal-loss损失函数。

16、在本专利技术的某些实施例中,当采用两种方式分类时,采用大语言通用模型对两个分类结果进行投票,并选择票数较高的分类结果。

17、在本专利技术的某些实施例中,所述步骤s6之后还包括:

18、s7,所述共性问题数据库中添加新的文本问题后,对数据库进行迭代更新,重新进行重要程度排序。

19、在本专利技术的某些实施例中,所述聚类算法采用k-means聚类算法。

20、一种基于大语言模型的级联共性问题挖掘系统,包括:

21、粗粒度共性问题筛选模块,使用小语言嵌入模型对文本问题进行特征向量表达,并通过聚类算法抽取所有的文本问题的第一数量的粗粒度共性问题;保留子问题数量最高的前第二数量的粗粒度共性问题;

22、细粒度共性问题筛选模块,获取所述前第二数量的粗粒度共性问题对应的原始文本问题,并使用大语言嵌入模型对所述原始文本问题进行特征向量表达,通过聚类算法抽取所述原始文本问题的第三数量的细粒度共性问题;保留子问题数量最高的前第四数量的细粒度共性问题;

23、大语言通用模型总结模块,针对所述前第四数量的细粒度共性问题,使用大语言通用模型进行总结归纳,获得第五数量的共性问题;

24、实体命名识别模块,对得到的第五数量的共性问题,使用大语言通用模型进行命名实体识别,并对所述共性问题进行重要程度排序。

25、在本专利技术的某些实施例中,所述基于大语言模型的级联共性问题挖掘系统还包括:共性问题数据库构建模块,基于历史数据构建共性问题数据库;以文本问题的特征向量作为键值k,共性问题作为值v,保存一个对应的字典用于保存文本问题和共性问题的元信息;

26、在本专利技术的某些实施例中,所述基于大语言模型的级联共性问题挖掘系统还包括:新问题扩充及分类模块,对于新加入的文本问题,获取其特征向量表达,在共性问题数据库中进行检索,将新加入的文本问题加入到与其相似度最大的原始文本问题所属的共性问题中作为其子问题。

27、在本专利技术的某些实施例中,所述基于大语言模型的级联共性问题挖掘系统还包括:数据库迭代更新模块,所述共性问题数据库中添加新的文本问题后,对数据库进行迭代更新,重新进行重要程度排序。

28、与现有技术相比,本专利技术的有益效果是:

29、1. 高效精准:本专利技术基于大语言模型的级联共性问题挖掘系统能够更有效地挖掘和发现文本中的共性问题。大语言模型对文本的深度理解能力,使得我们的系统在挖掘共性问题时能够实现更高的精度。同时,通过优化的计算策略和高效的算法设计,我们的系统在保持高精度的同时,能够大大提高处理速度。

30、2. 资源优化:虽然大语言模型在处理文本问题时需要大量的计算资源,但本专利技术通过特殊的模型设计和计算优化,大大减少了对计算资源的需求。这使得我们的系统可以在资源有限的环境中运行,提高了系统的适应性和可用性。

31、3. 强适应性:本专利技术的系统设计具有强大的适应性和扩展性。无论是处理不同类型的文本问题,还是适应不同的使用场景,都能通过模块化的系统设计和参数配置,快速地进行调整和优化。

32、4. 持续学习:与传统的基于规则的文本问题挖掘方法相比,本专利技术基于深度学习的模型设计,能够随着数据的增长,持本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的级联共性问题挖掘方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,所述步骤S4之后还包括:

3.根据权利要求2所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,往所述共性问题数据库中添加新的文本问题时,计算所述新的文本问题与共性问题数据库中已有问题的特征向量的相似度;若所述相似度大于设定的第一相似度阈值,则加入该新的文本问题。

4.根据权利要求3所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,所述步骤S5之后还包括:

5.根据权利要求4所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,当新加入的文本问题与已有问题的相似度均小于第二相似度阈值;采用以下方式一进行分类:构造提示词,将已经抽取出的共性问题作为候选集合,使用大语言通用模型预测新加入的文本问题所属的共性问题。

6.根据权利要求4或5所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,当新加入的文本问题与已有问题的相似度均小于第二相似度阈值;采用以下方式二进行分类:以步骤S1至步骤S3中的<文本问题,共性问题>的映射对作为训练集进行学生模型的训练;通过训练好的学生模型预测新加入的文本问题所属的共性问题。

7.根据权利要求6所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,所述学生模型采用focal-loss损失函数。

8.根据权利要求6所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,当采用两种方式分类时,采用大语言通用模型对两个分类结果进行投票,并选择票数较高的分类结果。

9.根据权利要求4所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,所述步骤S6之后还包括:

10.根据权利要求1所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,所述聚类算法采用K-means聚类算法。

...

【技术特征摘要】

1.一种基于大语言模型的级联共性问题挖掘方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,所述步骤s4之后还包括:

3.根据权利要求2所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,往所述共性问题数据库中添加新的文本问题时,计算所述新的文本问题与共性问题数据库中已有问题的特征向量的相似度;若所述相似度大于设定的第一相似度阈值,则加入该新的文本问题。

4.根据权利要求3所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,所述步骤s5之后还包括:

5.根据权利要求4所述的一种基于大语言模型的级联共性问题挖掘方法,其特征在于,当新加入的文本问题与已有问题的相似度均小于第二相似度阈值;采用以下方式一进行分类:构造提示词,将已经抽取出的共性问题作为候选集合,使用大语言通用模型预测新加入的文本问题所属的共性问题。

6.根据权利要求...

【专利技术属性】
技术研发人员:姜励王学高王璇
申请(专利权)人:浙江省公众信息产业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1