数据审核方法、装置、电子设备及存储介质制造方法及图纸

技术编号:44937020 阅读:44 留言:0更新日期:2025-04-12 01:14
本申请涉及人工智能技术领域,公开了一种数据审核方法、装置、电子设备及存储介质。该方法包括:接收多模态待审核数据,并对多模态待审核数据进行数据预处理,得到预设数据格式的待处理文本数据;获取至少一个预设的关键词词库,以及关键词词库对应的正则表达式匹配模块;使用正则表达式匹配模块处理待处理文本数据,从关键词词库中匹配到待处理文本数据对应的待审核关键词集合;获取多模态待审核数据对应的审核领域,根据审核领域生成预设大语言模型可接收的审核提示文本;发送待处理文本数据、待审核关键词集合和审核提示文本至预设大语言模型,接收大语言模型输出的数据审核结果。该方法降低了人力成本,提高数据审核效率和审核准确率。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种数据审核方法、装置电子设备及存储介质。


技术介绍

1、随着互联网的蓬勃发展,用户在互联网上生成内容的激增带来了对数据审核系统的迫切需求,以确保在线内容的合规性,并保护用户免受有害信息的影响。现有的数据审核方式有关键词匹配算法审核和人工审核两种方式。关键词匹配算法审核是一种自动化的数据审核方法,它通过预设的关键词列表来识别和过滤敏感或不当内容,在处理大量数据时效率较高,成本也相对较低。然而,关键词匹配技术往往因为关键词缺失而出现漏检的情况,例如,如果有害内容的发布者使用错别字、同义词或者编码方式来规避关键词过滤,那么这些内容可能会逃过算法的检测。此外,关键词匹配算法审核过度依赖关键词匹配,未从语义理解层面对文本进行审核,因此可能会错误地将无害的内容标记为有害,从而出现过检的情况。人工审核作为一种传统的数据审核方式,依赖于专业审核人员的判断力和经验,但当待审数据数量庞大、内容复杂繁多时,人工审核的难度和成本将变得非常高,审核人员需要在有限的时间内处理大量的信息,审核人员的审核效率需要进一步提高,同时也增加了审核出错的风险。此外,本文档来自技高网...

【技术保护点】

1.一种数据审核方法,其特征在于,包括:

2.根据权利要求1所述的数据审核方法,其特征在于,所述使用所述正则表达式匹配模块处理所述待处理文本数据,从所述关键词词库中匹配到所述待处理文本数据对应的待审核关键词的步骤之后,还包括:

3.根据权利要求1所述的数据审核方法,其特征在于,所述发送所述待处理文本数据、所述待审核关键词集合和所述审核提示文本至所述预设大语言模型的步骤之后,还包括:

4.根据权利要求3所述的数据审核方法,其特征在于,所述发送所述第四审核提示文本至所述预设大语言模型的步骤之后,还包括:

5.根据权利要求1所述的数据审核方法,其...

【技术特征摘要】

1.一种数据审核方法,其特征在于,包括:

2.根据权利要求1所述的数据审核方法,其特征在于,所述使用所述正则表达式匹配模块处理所述待处理文本数据,从所述关键词词库中匹配到所述待处理文本数据对应的待审核关键词的步骤之后,还包括:

3.根据权利要求1所述的数据审核方法,其特征在于,所述发送所述待处理文本数据、所述待审核关键词集合和所述审核提示文本至所述预设大语言模型的步骤之后,还包括:

4.根据权利要求3所述的数据审核方法,其特征在于,所述发送所述第四审核提示文本至所述预设大语言模型的步骤之后,还包括:

5.根据权利要求1所述的数据审核方法,其特征在于,所述接收所述预设大语言模型输出的数据审核结...

【专利技术属性】
技术研发人员:吴建汉黄章成王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1