文本处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:43121455 阅读:14 留言:0更新日期:2024-10-26 09:59
本申请公开了一种文本处理方法、装置、电子设备及存储介质。其中,方法包括:获取留言的第一文本;采用预设的第一大语言模型(LLM)对所述第一文本进行识别,得到所述第一文本中的情感信息和事件信息;采用预设的拟合算法对所述情感信息和所述事件信息进行拟合,得到所述第一文本的评估结果;所述评估结果用于表征对所述留言进行处理的紧急程度。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种文本处理方法、装置、电子设备及存储介质


技术介绍

1、政府留言板是公众与政府之间沟通交流的重要渠道,对留言涉及的内容按照重要程度或紧急程度进行有效地分类,对于后续精确回复留言具有重要作用,可以提高政府的公信力和服务水平,增强公众的满意度和信任度。现有分类方案主要包括三类,1、关键词分类处理,通过正则匹配等方式进行分类处理;2、基于传统自然语言处理(natural languageprocessing,nlp)模型分类处理,如双向编码器表示(bidirectional encoderrepresentations from transformers,bert)等文本分类模型;3、大模型直接识别留言内容进行分类,采用大语言模型通过自然语言提问的方式进行文本分类。上述三种方案存在主要问题如下:

2、1、关键词分类准确率低:采用固定的关键词匹配方式,无法覆盖各类使用场景,导致总体分类准确率低,泛化性差。

3、2、传统nlp模型需专门标注训练数据,泛化性差:传统nlp模型需要精确标注的专业化训练数据才能适配实际本文档来自技高网...

【技术保护点】

1.一种文本处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一LLM包括识别情感类要素的第一模型和识别事件类要素的第二模型,所述采用预设的大语言模型LLM对所述第一文本进行识别,得到所述第一文本中的情感信息和事件信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述情感信息包括情感极性参数和情感类型参数;所述情感极性参数表征情感的强弱程度;所述事件信息包括事件类型参数和事件领域参数;所述采用预设的拟合算法对所述情感信息和所述事件信息进行拟合,得到所...

【技术特征摘要】

1.一种文本处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一llm包括识别情感类要素的第一模型和识别事件类要素的第二模型,所述采用预设的大语言模型llm对所述第一文本进行识别,得到所述第一文本中的情感信息和事件信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述情感信息包括情感极性参数和情感类型参数;所述情感极性参数表征情感的强弱程度;所述事件信息包括事件类型参数和事件领域参数;所述采用预设的拟合算法对所述情感信息和所述事件信息进行拟合,得到所述第一文本的评估结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述采用预设...

【专利技术属性】
技术研发人员:刘伟东高东辉黄艳华刘硕焦若丹段宣翡
申请(专利权)人:中国移动通信有限公司研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1