基于大模型和动态知识检索的恶意文本内容审核系统和方法技术方案

技术编号:40546222 阅读:13 留言:0更新日期:2024-03-05 19:03
基于大模型和动态知识检索的恶意文本内容审核系统和方法,系统包括如下模块:语言模型模块、表征模型模块、动态知识库模块、多模态表征模块和内容分类模块;方法包括如下操作步骤:(1)将待分类文本输入到多模态表征模块;(2)多模态表征模块将待分类文本进行多模态表征处理,分别得到待分类文本的语义表征、字形表征和读音表征,然后将上述表征进行加权融合,得到所述待分类文本的融合特征;(3)将所述待分类文本的融合特征输入到所述语言模型模块中的轻量级文本分类语言模型中,得到待分类文本的类别。

【技术实现步骤摘要】

本专利技术涉及基于大模型和动态知识检索的恶意文本内容审核系统和方法,属于信息,特别是属于文本分类。


技术介绍

1、随着信息技术的飞速发展,网络平台已成为日常交流、商业活动和社会互动的主要平台。但同时,网络平台也变成了各类恶意行为的温床。当前,恶意内容的检测与拦截技术正面临前所未有的挑战。恶意用户利用传统深度学习模型的固有脆弱性,通过简单的文字变换或使用变体字生成对抗样本,从而规避自动化的内容审查系统。这些对抗样本不仅能够误导深度学习算法,还能在无形中破坏信息生态,引发一系列社会问题。

2、在恶意文本内容的审核方面,这一挑战尤其突出。恶意短信、社交媒体评论和电商评论等文本形式的信息流转速度快,体量大,且更新迭代速度极快。这不仅要求审核系统能够实时响应,还要求能够精准识别各种伪装和变体手段,保护用户免受侵害。

3、如何解决上述挑战,成为目前恶意文本内容审核
急需解决的一个技术难题。


技术实现思路

1、有鉴于此,本专利技术的目的是专利技术一种恶意文本内容审核系统和方法,能充分利用大模型本文档来自技高网...

【技术保护点】

1.基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:所述系统包括如下模块:

2.根据权利要求1所述的基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:所述的预训练好的语言模型LLMppo是按照如下计算过程获得的:

3.根据权利要求2所述的基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:

4.根据权利要求1所述的基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:所述的多模态表征模块计算文本的语义表征的具体内容是包括如下操作步骤:

5.根据权利要求1所述的基于大模型和动态知识检索的恶意文本内容审核系统...

【技术特征摘要】

1.基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:所述系统包括如下模块:

2.根据权利要求1所述的基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:所述的预训练好的语言模型llmppo是按照如下计算过程获得的:

3.根据权利要求2所述的基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:

4.根据权利要求1所述的基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:所述的多模态表征模块计算文本的语义表征的具体内容是包括如下操作步骤:

5.根据权利要求1所述的基于大模型和动态知识检索的恶意文本内容审核系统,其特征在于:所述的字形表征模型glyph-cnn基于lenet5改造而成,即将原lenet5的全连接层和输出层替换为一个包含d个尺寸为1*1的卷积核的卷积层和一个全局平均池化层,其中d为所述动态数据库中语义...

【专利技术属性】
技术研发人员:张磊王玉龙张坤旭赵海秀李炜王晶
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1