一种用户文本摘要方法、装置及电子设备制造方法及图纸

技术编号:44268543 阅读:20 留言:0更新日期:2025-02-14 22:10
本申请提供一种用户文本摘要方法、装置及电子设备,该方法包括:对待处理的用户文本进行聚类,获得多个类簇;针对多个类簇中的每个类簇,使用大语言模型对该类簇下的全部用户文本进行问题摘要,获得问题摘要文本;使用小网络模型预测出该类簇下的全部用户文本与问题摘要文本之间的匹配概率,小网络模型的模型参数少于大语言模型的模型参数;根据匹配概率和问题摘要文本确定最终摘要结果。在上述方案的实现过程中,通过结合具有强大生成能力和理解力的大语言模型和具有实时性的小网络模型,兼顾了用户文本摘要的精准性和实时性之间的平衡。

【技术实现步骤摘要】

本申请涉及深度学习、神经网络和文本处理的,具体而言,涉及一种用户文本摘要方法、装置及电子设备


技术介绍

1、目前,开源的大语言模型(large language model)作为通用模型的准确率能够达到70%左右,但面对特定专业领域的文本摘要任务时,它们往往表现得不尽如人意。这主要是因为大语言模型在预训练阶段所接触的数据过于泛化,缺乏对某一特定领域的深度理解。因此,想要使用大语言模型对专业领域用户输入的文本进行摘要总结时,仍然需要重新对大语言模型进行微调训练,才能达到在商业场景中进行使用的标准。然而,这一过程也带来了新的挑战,尤其是兼顾文本摘要的精准性和实时性之间的平衡,精准性的提升通常意味着需要更多的训练时间和计算资源,实时性的需求则与模型的复杂性和训练时间形成冲突。


技术实现思路

1、本申请实施例的目的在于提供一种用户文本摘要方法、装置及电子设备,用于改善难以兼顾文本摘要的精准性和实时性之间的平衡的问题。

2、本申请实施例提供了一种用户文本摘要方法,包括:对待处理的用户文本进行聚类,获得多个本文档来自技高网...

【技术保护点】

1.一种用户文本摘要方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述对待处理的用户文本进行聚类之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述用户文本进行聚类,包括:

4.根据权利要求3所述的方法,其特征在于,在所述获得多个词语之后,还包括:

5.根据权利要求1所述的方法,其特征在于,所述使用大语言模型对该类簇下的全部用户文本进行问题摘要,包括:

6.根据权利要求5所述的方法,其特征在于,所述预设类别标签,包括:商品类别标签和问题类别标签;所述根据预设类别标签对该类簇下的全部用户文本...

【技术特征摘要】

1.一种用户文本摘要方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述对待处理的用户文本进行聚类之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述用户文本进行聚类,包括:

4.根据权利要求3所述的方法,其特征在于,在所述获得多个词语之后,还包括:

5.根据权利要求1所述的方法,其特征在于,所述使用大语言模型对该类簇下的全部用户文本进行问题摘要,包括:

6.根据权利要求5所述的方法,其特征在于,所述预设类别标签,包括:商品类别标签和问题类别标签;所述根据预设类别标签对该类簇下的全部用户文本进行打标签,包括:

7.根据权利要求5所述的方法,其特征在于,在所述获得多个文本标签之后,还包括:

8.根据权利要求1所述的方法,其特征在于,在所述使用小网络模型预测出该类簇下的全部用户文本与所述问题摘要...

【专利技术属性】
技术研发人员:王文豪刘谕齐刘露郭林王夏飞
申请(专利权)人:上海得物信息集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1