一种基于大语言模型识别社区内容垃圾评论的方法及装置制造方法及图纸

技术编号:42041121 阅读:16 留言:0更新日期:2024-07-16 23:25
本公开实施例提出了一种基于大语言模型识别社区内容垃圾评论的方法及装置,所述方法包括:获取目标网络平台中未识别的评论及相应的内容,构建待判别的内容和评论数据库;从所述待判别的内容和评论数据库中提取所有未识别的评论内容以及其相应的内容文本和/或内容图片;根据预设的提示词模板,将预处理后的评论内容以及相应的内容文本填入所述提示词模板,生成相应提示词,将所述提示词输入预先训练的大语言模型,得到评论内容的得分;根据所述评论内容的得分,判断所述评论内容是否为垃圾评论或者疑似垃圾评。本公开实施例将评论与内容通过大语言模型对垃圾评论进行评分,有助于判别评论与内容的相关性,从而对垃圾评论的识别准确率更高。

【技术实现步骤摘要】

本公开实施例涉及知识发现和数据挖掘,尤其涉及一种基于大语言模型识别社区内容垃圾评论的方法、装置、电子设备及计算机存储介质。


技术介绍

1、在社区类app中,公司会大力鼓励用户在内容下发表评论,评论可以对原始内容进行补充、解释、评价、批评等。社区内容评论是社区互动的重要组成部分,可以促进用户之间的交流和互动,同时也可以为平台提供有价值的用户反馈和意见。然而,社区内容评论也可能存在一些负面影响,如与内容无关的广告帖、虚假信息等垃圾评论,需要平台进行管理和监控。目前常见的垃圾评论识别方法以及他们的缺点主要有一下三点:

2、1.人工质检:这是一种传统但有效的方法,通过人工审核对评论进行筛选,但由于效率低下且成本较高,难以应对大规模评论数据的处理需求;

3、2.关键词规则:利用预先设定的关键词和规则进行垃圾评论的识别。这种方法在简单情况下表现良好,但容易受限于静态的关键词列表,难以适应日益变化的网络语言和垃圾评论形式;

4、3.机器学习(包含深度学习)模型:通过利用大量带标签的评论数据对机器学习模型进行训练,如支持向量机、随机森林本文档来自技高网...

【技术保护点】

1.一种基于大语言模型识别社区内容垃圾评论的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述根据所述评论内容的得分,判断所述评论内容是否为垃圾评论,若所述评论内容的得分小于等于第一阈值时,则所述评论内容为垃圾评论,若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:

4.根据权利要求1~3任一项所述的方法,其特征在于,所...

【技术特征摘要】

1.一种基于大语言模型识别社区内容垃圾评论的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述根据所述评论内容的得分,判断所述评论内容是否为垃圾评论,若所述评论内容的得分小于等于第一阈值时,则所述评论内容为垃圾评论,若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:

4.根据权利要求1~3任一项所述的方法,其特征在于,所述分别对提取的评论内容以及其相应的内容文本和/或内容图片进行预处理,包括:

5.根据权利要求4所述的方法,其特征在于,所述多模态模型包括:chatgpt,minigpt4,visualglm...

【专利技术属性】
技术研发人员:毛王珍陈建虎
申请(专利权)人:无线生活北京信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1