【技术实现步骤摘要】
本公开实施例涉及知识发现和数据挖掘,尤其涉及一种基于大语言模型识别社区内容垃圾评论的方法、装置、电子设备及计算机存储介质。
技术介绍
1、在社区类app中,公司会大力鼓励用户在内容下发表评论,评论可以对原始内容进行补充、解释、评价、批评等。社区内容评论是社区互动的重要组成部分,可以促进用户之间的交流和互动,同时也可以为平台提供有价值的用户反馈和意见。然而,社区内容评论也可能存在一些负面影响,如与内容无关的广告帖、虚假信息等垃圾评论,需要平台进行管理和监控。目前常见的垃圾评论识别方法以及他们的缺点主要有一下三点:
2、1.人工质检:这是一种传统但有效的方法,通过人工审核对评论进行筛选,但由于效率低下且成本较高,难以应对大规模评论数据的处理需求;
3、2.关键词规则:利用预先设定的关键词和规则进行垃圾评论的识别。这种方法在简单情况下表现良好,但容易受限于静态的关键词列表,难以适应日益变化的网络语言和垃圾评论形式;
4、3.机器学习(包含深度学习)模型:通过利用大量带标签的评论数据对机器学习模型进行训练,如
...【技术保护点】
1.一种基于大语言模型识别社区内容垃圾评论的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述评论内容的得分,判断所述评论内容是否为垃圾评论,若所述评论内容的得分小于等于第一阈值时,则所述评论内容为垃圾评论,若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:
4.根据权利要求1~3任一项所述的
...【技术特征摘要】
1.一种基于大语言模型识别社区内容垃圾评论的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述评论内容的得分,判断所述评论内容是否为垃圾评论,若所述评论内容的得分小于等于第一阈值时,则所述评论内容为垃圾评论,若所述评论内容的得分大于第一阈值小于等于第二阈值时,则所述评论内容为疑似垃圾评论之后,所述方法还包括:
4.根据权利要求1~3任一项所述的方法,其特征在于,所述分别对提取的评论内容以及其相应的内容文本和/或内容图片进行预处理,包括:
5.根据权利要求4所述的方法,其特征在于,所述多模态模型包括:chatgpt,minigpt4,visualglm...
【专利技术属性】
技术研发人员:毛王珍,陈建虎,
申请(专利权)人:无线生活北京信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。